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Description 

[0001 ] La presente invention a pour objet un procede 
d'obtention d'ADN, ARN, peptides, polypeptides ou pro- 
teines, au moyen de cellules-notes modifiees contenant 
des genes capables d'exprimer ces ARN, peptides, po- 
lypeptides ou proteines, c'est-a-dire en utilisant une 
technique de recombinaison d'ADN. 
[0002] L'invention vise notamment a produire des ge- 
nes ou fragments de genes produits de maniere sto- 
chastique, de facon a permettre I'obtention simultanee, 
apres transcription et traduction de ces genes, d'un tres 
grand nombre (de I'ordre de dix mille au moins) de pro- 
teines completement nouvelles ou hybrides de protei- 
nes connues, en presence de cellules-notes (souches 
bacteriennes ou eucaryotes) contenant les genes res- 
pectivement capables d'exprimer ces proteines et d'ef- 
fectuer ensuite une selection ou criblage parmi lesdites 
souches, en vue de determiner celles qui produisent des 
proteines presentant des proprietes desirees, par 
exemple des proprietes structurelles enzymatiques, ca- 
talytiques, antigeniques, pharmacologiques, ou des 
proprietes de ligand, et plus generalement, des proprie- 
tes chimiques, biochimiques, biologiques, etc. 
[0003] L'invention a egalement pour but de permettre 
I'obtention de sequences d'ADN ou d'ARN presentant 
des proprietes utilisables, notamment des proprietes 
chimiques, biochimiques ou biologiques. 
[0004] On comprend done que l'invention est suscep- 
tible de recevoir de tres nombreuses applications, dans 
des domaines tres varies de la science, de I'industrie et 
de la medecine. 

[0005] Le procede de production de peptides ou po- 
lypeptides selon l'invention est caracterise en ce que 
Ton produit simultanement, au sein d'un meme milieu, 
des genes au moins partiellement composes de poly- 
nucleotides synthetiques produits de maniere stochas- 
tique, que Ton introduit les genes ainsi obtenus dans des 
cellules-notes, que Ton cultive simultanement les sou- 
ches independantes de cellules-notes modifiees renfer- 
mant ces genes, de maniere a doner les genes stochas- 
tiques et a provoquer la production des proteines expri- 
mees par chacun de ces genes produits de maniere sto- 
chastique, que Ton effectue le criblage et/ou la selection 
des souches de cellules-notes modifiees de facon a 
identifier les souches produisant des peptides ou poly- 
peptides ayant au moins une propriete donnee, que Ton 
isole les souches ainsi identifies et qu'on les cultive de 
facon a produire au moins un peptide ou polypeptide 
ayant ladite propriete. 

[0006] Conformement a un premier mode de mise en 
oeuvre de ce procede, on produit les genes par copoly- 
merisation stochastique des quatre sortes de deoxy- 
phosphonucleotides A, C, G et T a partir des deux ex- 
tremites d'un vecteur d'expression prealablement linea- 
rise, puis formation d'extremites cohesives de facon a 
former un premier brin d'ADN produit de maniere sto- 
chastique, constitue d'une molecule du vecteur d'ex- 



pression possedantdeux sequences produits de manie- 
re stochastique dont les extremites 3' sontcomplemen- 
taires, suivie de la synthese du second brin de cet ADN 
produit de maniere stochastique. 

5 [0007] Selon un deuxieme mode de mise en oeuvre, 
on produit les genes par copolymerisation stochastique 
d'oligonucleotides sans extremites cohesives, de fagon 
a former des fragments d'ADN produits de maniere sto- 
chastique, suivie de la ligation de ces fragments a un 

10 vecteur d'expression prealablement linearise. 

[0008] Le vecteur d'expression peut etre un plasmide, 
notamment un plasmide bacterien. D'excellents resul- 
tats ont ete obtenus en utilisant, comme vecteur d'ex- 
pression, le plasmide pUC8. 

15 [0009] Le vecteur d'expression peut egalement etre 
un ADN viral ou un hybride de plasmide et d'ADN viral. 
[0010] Les cellules-hotes peuvent etre des cellules 
procaryotes telles que les cellules HB 101 et C 600, ou 
des cellules eucaryotes. 

20 [0011] Lorsque Ton procede conformement au 
deuxieme mode de mise en oeuvre susmentionne, on 
peut utiliser des oligonucleotides formant un groupe 
d'octameres palindromiques. 

[0012] Des resultats particulierement bons sont obte- 
25 nus en utilisant le groupe d'octameres palindromiques 
suivant : 



5 » 


GGAATTCC 


3' 


5 * 


GGTCGACC 


3' 


5 ' 


CAAGCTTG 


3 ' 


5 » 


CCATATGG 


3' 


5 ' 


CATCGATG 


3' 



On peut egalement utiliser des oligonucleotides formant 
un groupe d'heptameres palindromiques. 
40 [0013] De tres bons resultats sont obtenus en utilisant 
le groupe d'heptameres palindromiques suivant : 

45 5 1 XTCGCGA 3 1 

5' XCTGCAG 3 r 
5' RGGTACC 3 r 

50 

ou X = A, G, C ou T et R = A ou T. 
[0014] Conformement a un mode de mise en oeuvre 
particulierement avantageux, Ton isole et purifie I'ADN 
transformant des plasmides provenant d'une culture de 
55 souches independantes de cellules-hotes modifiees ob- 
tenues en procedant de la maniere specifiee ci-dessus, 
puis Ton provoque la coupure de I'ADN purifie au moyen 
d'au moins un enzyme de restriction correspondant a 
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un site specifique de coupure enzymatique present 
dans ces octameres ou heptameres palindromiques 
mais absent du vecteur d'expression utilise, cette cou- 
pure etantsuivie de I'inactivation de I'enzyme de restric- 
tion, et Ton traite ensuite simultanement I'ensemble des 
fragments d'ADN produits de maniere stochastique li- 
nearises, ainsi obtenus, par la T4 DNA ligase, de facon 
a creer un nouvel ensemble d'ADN contenant des se- 
quences produits de maniere stochastique nouvelles, 
ce nouvel ensemble pouvant done contenir un nombre 
de genes produits de maniere stochastique superieur 
au nombre de genes de I'ensemble initial, et on utilise 
ce nouvel ensemble d'ADN transformant pour modifier 
des cellules-hotes et doner les genes, et, finalement, 
on crible et/ou on selectionne et on isole les nouvelles 
souches de cellules-hotes transformees et finalement, 
on les cultive de facon a produire au moins un peptide 
ou polypeptide, par exemple une proteine nouvelle. 
[001 5] La propriete servant de critere de selection des 
souches de cellules-hotes peut etre I'aptitude des pep- 
tides ou polypeptides, produits par cette souche, a se 
lier a un ligand donne. 

[0016] L'invention a egalement pour objet I'utilisation 
du peptide ou polypeptide obtenu par le procede speci- 
fic ci-dessus pour la detection et/ou la titration d'un li- 
gand. 

[0017] Conformement a un mode de mise en oeuvre 
particulierement avantageux, le critere de selection de 
la souche de cellules-hotes modifiee est I'aptitude des 
peptides ou polypeptides a simulerou modifier les effets 
d'une molecule biologiquement active, par exemple une 
proteine, et Ton effectue le criblage et/ou la selection de 
la souche de cellules-hotes modifiee produisant au 
moins un peptide ou polypeptide ayant cette propriete 
en preparant des anticorps contre cette molecule active, 
et en utilisant ces anticorps, apres leur purification, pour 
identifier les souches contenant ce peptide ou polypep- 
tide, puis en cultivant les souches ainsi identifies et en 
separant et en purifiant le peptide ou polypeptide produit 
par ces souches, et, finalement, en soumettant ce pep- 
tide ou polypeptide a un essai in vitro pour verifier qu'il 
presente bien I'aptitude a simuler ou modifier les effets 
de ladite molecule. 

[0018] Conformement a un autre mode de mise en 
oeuvre du procede selon l'invention, la propriete servant 
de critere de selection est d'avoir au moins un epitope 
semblable a I'un des epitopes d'un antigene donne. 
[0019] Selon une variante du procede, Ton identifie et 
isole les souches de cellules-hotes modifiees produi- 
sant les peptides ou polypeptides ayant la propriete de- 
siree par chromatographie d'affinite sur anticorps cor- 
respondant a une proteine exprimee par la partie natu- 
relle de I'ADN hybride. 

[0020] Par exemple, dans le cas ou la partie naturelle 
de I'ADN hybride contient un gene exprimant la [3-galac- 
tosidase, Ton peut avantageusement identifier et isoler 
lesdites souches de cellules-hotes modifiees par chro- 
matographie d'affinite sur anticorps anti-(3-galactosida- 



se. 

[0021] Apres expression et purification des peptides 
ou polypeptides hybrides, on peut separer et isoler leurs 
parties nouvelles. 
5 [0022] L'invention porte egalement sur une applica- 
tion du procede specifie ci-dessus pour la preparation 
d'un vaccin, cette application etantcaracterise par le fait 
que Ton isole des anticorps contre un agent pathogene, 
par exemple des anticorps formes apres injection de cet 
agent pathogene dans I'organisme d'un animal capable 
de former des anticorps contre cet agent, et on utilise 
ces anticorps pour identifier les clones produisant au 
moins une proteine ayant au moins un epitope sembla- 
ble a I'un des epitopes de I'agent pathogene, on cultive 
les souches de cellules-hotes modifiees correspondant 
a ces clones, de f agon a produire cette proteine, on isole 
et purifie cette proteine a partir des cultures de ces sou- 
ches de cellules, et on utilise cette proteine pour la pro- 
duction d'un vaccin contre I'agent pathogene. 
[0023] Par exemple, pour la preparation d'un vaccin 
anti-HVB, Ton peut extraire et purifier au moins une pro- 
teine de capside de virus HVB, injecter cette proteine 
dans I'organisme d'un animal capable de former des an- 
ticorps contre cette proteine, recueillir et purifier les an- 
ticorps ainsi formes, utiliserces anticorps pour identifier 
les clones produisant au moins une proteine ayant au 
moins un epitope semblable a I'un des epitopes du virus 
HVB, cultiver les souches de cellules-hotes modifiees 
correspondant a ces clones, de facon a produire cette 
proteine, isoler et purifier cette proteine a partir des cul- 
tures de ces souches de cellules, et utiliser cette protei- 
ne pour la production d'un vaccin anti-HVB. 
[0024] Avantageusement, conformement a un mode 
de mise en oeuvre du procede selon l'invention, les cel- 
lules-hotes consistent en bacteries du genre Escheri- 
chia coli dont le genome ne contient ni le gene naturel 
exprimant la p-galactosidase, ni le gene EBG, e'est-a- 
dire des bacteries E. coli (Z~, EBG ), on cultive les cel- 
lules-hotes modifiees en presence du milieu X-gal et de 
I'inducteur IPTG, que Ton detecte, dans le milieu de cul- 
ture, les clones positifs pour la fonction (3-galactosidase, 
et, finalement, on transplante ensuite cet ADN dans une 
souche de cellules-hotes appropriee a la culture en 
grande quantite en vue de la production industrielle d'au 
moins un peptide ou polypeptide. 
[0025] La propriete servant de critere de selection des 
souches de cellules-hotes transformees peut egale- 
ment etre I'aptitude, des polypeptides ou proteines, pro- 
duces par culture de ces souches, a se lier a un com- 
pose donne. 

[0026] Ce compose peut etre, notamment, avanta- 
geusement choisi parmi les peptides, les polypeptides 
et les proteines, notamment les proteines regulatrices 
de I'activite de transcription de I'ADN. 
[0027] D'autre part, ledit compose peut egalement 
etre choisi parmi les sequences d'ADN et d'ARN. 
[0028] L'invention a egalement pour objet les protei- 
nes obtenues dans le cas ou la propriete servant de cri- 
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tere de selection des souches de cellules-hote transfor- 
mees consiste precisement dans I'aptitude de ces pro- 
teines a se lier a des proteines regulatrices de I'activite 
de transcription de I'ADN, ou encore a des sequences 
d'ADN ou d'ARN. 

[0029] L'invention a, en outre, pour objet I'utilisation 
d'une proteine, obtenue dans le premier cas particulier 
qui vient d'etre mentionne, comme sequence cis-regu- 
latrice de la replication ou la transcription d'une sequen- 
ce d'ADN voisine. 

[0030] D'autre part, l'invention a egalement pour objet 
I'utilisation des proteines obtenues dans le second cas 
particulier susmentionne pour modifier les proprietes de 
transcription ou de replication d'une sequence d'ADN, 
dans une cellule contenant cette sequence d'ADN, et 
exprimant cette proteine. 

[0031 ] L'invention a egalement pour objet un procede 
de production d'ADN, caracterise par le fait que Ton pro- 
duit simultanement, au sein d'un meme milieu, des ge- 
nes au moins partiellement composes de polynucleoti- 
des synthetiques stochastiques, que Ton introduit les 
genes ainsi obtenus dans des cellules-notes, de fagon 
a produire un ensemble de cellules-notes modifiees, 
que Ton effectue un criblage et/ou une selection de cet 
ensemble, de fagon a identifier les cellules notes qui 
renferment dans leur genome des sequences stochas- 
tiques d'ADN presentant au moins une propriete desi- 
ree, et Ton isole finalement I'ADN a partir de cultures 
des cellules-hotes ainsi identifiees. 
[0032] L'invention a, en outre, pour objet un procede 
de production d'ARN, caracterise par le fait que Ton pro- 
duit simultanement, au sein d'un meme milieu, des ge- 
nes au moins partiellement composes de polynucleoti- 
des synthetiques stochastiques, que Ton introduit les 
genes ainsi obtenus dans des cellules-hotes, de fagon 
a produire un ensemble de cellules-hotes modifiees, 
que Ton cultive simultanement les souches independan- 
tes de cellules-hotes modifiees ainsi produites, que Ton 
effectue un criblage et/ou une selection de cet ensem- 
ble, de fagon a identifier les cellules-hotes qui renfer- 
ment des sequences stochastiques d'ARN presentant 
au moins une propriete desiree, et que Ton isole I'ARN 
a partir de cultures de cellules-hotes ainsi identifiees. 
[0033] Ladite propriete peut etre, I'aptitude a se lier a 
un compose donne, qui peut etre, par exemple, un pep- 
tide, un polypeptide ou une proteine. 
[0034] On va maintenant decrire, plus en details, le 
procede selon l'invention, ainsi que certaines de ses ap- 
plications, en se referant a des exemples, non limitatifs, 
de mise en oeuvre. 

[0035] Tout d'abord, on va decrire des modes opera- 
toires particulierement avantageux pour effectuer la 
synthese de genes produits de maniere stochastique et 
I'introduction de ces genes dans des bacteries, de ma- 
niere a produire des souches de bacteries transfor- 
mees. 



I) Synthese directe sur un vecteur d'expression 

a) Linearjs_ation du vecteur 

5 [0036] 30 jug (c'est-a-dire approximativement 10 13 
molecules) du vecteur d'expression pUC8 sont lineari- 
ses par incubation pendant 2 heures a 37°(avec 100 
unites de I'enzyme de restriction Pstl dans une volume 
de 300 |iil du tampon standard approprie. Le vecteur li- 

10 nearise est traite au phenol-chloroforme puis precipite 
a I'ethanol, repris dans un volume de 30 jnl et charge sur 
un gel d'agarose a 0,8 %, en milieu standard TEB. Apres 
migration dans un champ de 3V/cm pendant trois heu- 
res, le vecteur lineaire est electro-elue, precipite a 

15 I'ethanol et repris dans 30 jllI d'eau. 

b ) Sy nthese_ stochasti g u e_ par J ' e n zy_me 
Je rm in al 1 Tra_n_sfe_ras_e_ (Jd J} 

20 

[0037] On fait reagir 30 jug du vecteur linearise avec 
30 unites de TdT dans 300 jnl du tampon approprie, pen- 
dant deux heures, a 37°C, en presence de 1mM de 
dGTP, 1 mM de dCTP, 0,3mM de dTTP et 1 mM de dATP: 
25 On choisit une concentration plus basse de dTTP, dans 
le but de diminuer la frequence des codons "stop" dans 
I'ARN messagercorrespondant. Un resultat semblable, 
quoique moins favorable, peut etre obtenu en utilisant 
une concentration plus basse pour le d'ATP que pour 
30 les autres deoxynucleotides triphosphates. Le progres 
de la reaction de polymerisation sur I'extremite 3' des 
sites Pst I est suivi par I'analyse sur gel de parties ali- 
quotes prelevees en cours de reaction. 
[0038] Lorsque la reaction atteint ou depasse une va- 
35 leur moyenne de 300 nucleotides par extremite 3', elle 
est interrompue et les nucleotides libres sont separes 
du polymere par precipitation differentielle ou par pas- 
sage sur tamis moleculaire du type Biogel P60. Apres 
concentration par precipitation a I'ethanol, le polymere 
40 est soumis sequentiellement a une polymerisation sup- 
plemental par TdT en presence de dATP d'abord, puis 
de dTTP. Ces deux dernieres reactions sont separees 
par une filtration sur gel et conduites pendant des temps 
courts (30 secondes a 3 minutes), de maniere a aboutir 
45 a I'addition sequentielle de 1 0-30A, suivis de 1 0-30 T a 
I'extremite 3' des polymeres. 

c) Synth esed u second brin de TADNp rod u it de man iere 
stochasjigue 

50 

[0039] Chaque molecule de vecteur possede, a Tis- 
sue des operations precedentes, deux sequences sto- 
chastiques dont les extremites 3' sontcomplementaires. 
Le melange de polymeres est alors incube dans des 
55 conditions favorisant I'hybridation de ces extremites 
complementaires (150 mM Nacl, 10 mM Tris-HCI, pH 
7,6, 1 mM EDTA, a 65°C, pendant 10 minutes, puis 
abaissement de la temperature jusqu'a 22°C, a raison 
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de 3 a 4°C/heure). Les polymeres hybrides sont alors 
soumis a Taction de 60u du grand fragment de la poly- 
merase I (Klenow) en presence des quatre nucleotides 
triphosphates (200mM) a 4°C, pendant deux heures. 
Cette etape realise la synthese du second brin a partir 
de I'extremite 3' des polymeres hybrides. Les molecules 
resultant de cette synthese directe a partir d'un vecteur 
linearise sont alors utilisees pour transformer des cellu- 
les competentes. 

d) Transformation des_s_o_u c h es_ co_m p_e_te ntes 

[0040] 1 00 a 200 ml de cellules competentes HB1 01 
ou C600, a la concentration de 10 10 cellules/ml, sont 
incubes avec la preparation d'ADN produit de maniere 
stochastique, en presence de 6mM CaCI 2 , 6 mM Tris- 
Hcl, pH8, 6 mM MgCI 2 , pendant 30 minutes, a 0°C. Un 
choc thermique de 3 minutes a 37°C est impose au me- 
lange, suivi par I'addition de 400-800 ml de milieu de 
culture NZY, sans antibiotique. La culture transformee 
est incubee a 37°C pendant 60 minutes, puis diluee a 
1 0 litres par addition de milieu NZY contenant 40 jug/ml 
d'ampicilline. Apres 3 a 5 heures d'incubation a 37°C, 
la culture amplifiee est soumise a une centrifugation, et 
le culot des cellules transformees est lyophilyse et con- 
serve a -70°C. Une telle culture comprend de 3 x 1 0 7 a 
10 8 transformants independants, contenant chacun un 
gene produit de maniere stochastique unique insere 
dans un vecteur d'expression. 

II) Synthese_de g e n e s_p r_o_d u its d e man ier e s to c h a s_t i g u e 
a _partir d'o\\ g q-n u c I eqti_des s an s_ ext remi te s co h esjves 

[0041 ] Ce mode operatoire est fonde sur le fait que la 
polymerisation d'oligonucleotides palindromiques judi- 
cieusement choisis permet d'assembler des genes pro- 
duits de maniere stochastique ne comportant aucun co- 
don "stop" dans chacun des six cadres de lecture pos- 
sibles, tout en assurant une representation equilibree 
de triplets specifiant tous les acides amines. Par 
ailleurs, et pour eviter la repetition de motifs de sequen- 
ces dans la proteine resultante, les oligonucleotides 
penvent comporter un nombre de bases qui n'est pas 
un multiple de trois. L'exemple suivant decrit I'utilisation 
d'une combinaison possible d'oligonucleotides qui rem- 
plit ces criteres : 

a) C h o i x _d^u_n_cjr o u p e_ d'octameres 

[0042] Le groupe d'oligonucleotides suivant : 



c t 

D 




O t 

J 


5 1 


GGTCGACC 


3 ' 


5' 


CAAGCTTG 


3' 


5 ' 


CCATATGG 


3' 


5' 


CATCGATG 


3' 



est compose de 5 palindromes (done autocomplemen- 
taires) dont il est facile de verifier que leur polymerisa- 
tion stochastique n'engendre pas de codon "stop" et 
specifie tous les acides amines. 
[0043] Bien entendu, on pourrait egalement utiliser 
d'autres groupes d'octameres palindromiques n'engen- 
drant pas de codons "stop" et specifiant tous les acides 
amines des polypeptides. On comprendra egalement 
que Ton pourrait utiliser des groupes d'octameres non 
palindromiques acondition d'employer aussi leurs com- 
plements par la formation de segments bicatenaires. 

b) Asse_mblage_ d'un gene produit de man [ere stochasj 
tigue_ a partir d'un cj r o_up e j^o_ct a_m e r e s 

[0044] On fait reagir un melange comportant 5 jug de 
chacun des oligonucleotides indiques ci-dessus (prea- 
lablement phosphoryles en 5' par un procede connu en 
soi) dans un volume de 1 00 jnl contenant 1 mM ATP, 1 0 
% de polyethyleneglycol et 100 u de T 4 DNA ligase, 
dans le tampon approprie, a 13°C, pendant six heures. 
Cette etape effectue la polymerisation stochastique des 
oligomeres sous forme bi-catenaire, sans extremites 
cohesives. On isole alors par passe sur tamis molecu- 
laire (Biogel P60) les polymeres resultant de ('assem- 
blage de 20 a 1 00 oligomeres. Apres concentration, cet- 
te fraction est a nouveau soumise a la polymerisation 
catalysee par la T4 DNA ligase dans les conditions de- 
crees ci-dessus. On isole alors, comme decrit plus haut, 
les polymeres resultant de I'assemblage d'au moins 1 00 
oligomeres. 

c) Prep_aration i^uj3jas_rnide-hote 

45 [0045] Le vecteurd'expression pUC8 est linearise par 
I'enzyme Sma I dans le tampon approprie, comme decrit 
ci-dessus. Le vecteur linearise par I'enzyme Sma I ne 
comporte pas d'extremites cohesives. Le vecteur linea- 
rise est alors traite par la phosphatase alcaline d'intestin 

50 de veau (CIP) a raison d'une unite par jug de vecteur 
dans le tampon approprie, a37°C, pendant 30 minutes. 
L'enzyme CIP est alors inactivee par deux extractions 
successives au phenol-chloroforme. Le vecteur lineari- 
se et dephosphoryle est precipite a I'ethanol puis repris 

55 dans I'eau a 1 mg/ml. 
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d) Ligationdes genes J? rod u its de maniere stochastigue 
au vecteur 

[0046] Des quantites equimolaires de vecteur et de 
polymere sont melangees et incubees en presence de 
1 000 u de T4 DNA ligase, 1 mM ATP, 1 0 % de polyethy- 
lene glycol dans le tampon approprie, pendant 12 heu- 
res, a 13°C. Cette etape realise la ligation des polyme- 
res dans le vecteur d'expression et engendre des mo- 
lecules bicatenaires, circulaires et, par consequent, 
transformantes. 

Transformation des souches competentes 

[0047] On procede a la transformation des souches 
competentes de la maniere precedemment decrite. 

Ill) Ass em b I acj e_ d'un_gene_ p rod u it de man ie_r e stop h as_- 
tigue_a partir d'un cj roup e _d^h_epta_m e_r es 

[0048] Ce mode operatoire se distingue de celui qui 
vient d'etre decrit par le par le fait qu'il utilise des hep- 
tameres palindromiques comportant une extremite co- 
hesive variable, au lieu d'octameres. II presente I'avan- 
tage de permettre I'assemblage de sequences produits 
de maniere stochastique comportant une plus faible 
proportion de motifs identiques. 

a) C h o i x _dJJ_n_c|ro u p e_ d' h eptameres 

[0049] On peut utiliser, par exemple, les 3 heptame- 
res palindromiques suivants : 

5 1 XTCGCGA 3 1 
5 1 XCTGCAG 3 1 
5 ' RGGTACC 3 1 

pour lesquels X = A, G, C ou T et R = A ou T et dont la 
polymerisation ne peut engendrer de codons "stop" et 
comporte des triplets specifianttous les acides amines. 
[0050] Bien entendu, on pourrait egalement utiliser 
tout autre groupe d'heptameres remplissantces memes 
conditions. 

b) P o ly me r i s at ion _cT uji_ gro u p e_ d'heptameres 

[0051 ] Cette polymerisation s'effectue exactement de 
la maniere precedemment decrite dans le cas des oc- 
tameres. 

c) Eli m in at ion d es_ extre m\ ites co h esjves 

[0052] Les polymeres ainsi obtenus comportent une 
base non appariee a leur deux extremites 5'. II est done 
necessaire d'additionner la base complementaire aux 



extremites 3' correspondantes. Ceci s'effectue de la ma- 
niere suivante : on fait reagir 1 0 jug de polymeres double 
brin avec 10 u d'enzymes de Klenow, en presence des 
quatre deoxynucleotidephosphates (200 mM) dans un 

5 volume de 1 00 jul, a4°C, pendant 60 minutes. L'enzyme 
est inactivee par extraction au phenol-chloroforme et les 
polymeres sont debarrasses des nucleotides libres re- 
siduels par precipitation differentielle. Les polymeres 
sont alors ligases au plasmide-hote (prealablement li- 

10 nearise et dephosphoryle) en procedant de la maniere 
decrite ci-dessus. 

[0053] II est a remarquer que les deux derniers modes 
operatoires qui viennent d'etre decrits utilisent des oc- 
tameres ou heptameres palindromiques qui constituent 

15 des sites specifiques d'enzymes de restriction. Ces si- 
tes sont absents pour la plupart du vecteur d'expression 
pUC8. II est done possible d'augmenter considerable- 
ment la complexite d'une preparation initiale de genes 
stochastiques en procedant de la maniere suivante : on 

20 prepare I'ADN des plasmides provenant d'une culture 
de 1 0 7 transformants independants obtenus par I'un des 
deux derniers modes operatoires decrits ci-dessus. A 
cet ADN purifie, on fait alors subir une digestion partielle 
par l'enzyme de restriction Cla I (mode operatoire II) ou 

25 par l'enzyme de restriction Pst I (mode operatoire III). 
Apres inactivation de l'enzyme, I'ADN partiellement di- 
gere est traite a la T4 DNA ligase, ce qui a pour effet de 
creer un nombre extremement grand de sequences 
nouvelles qui conservent les proprietes fondamentales 

30 des sequences initiales. Ce nouvel ensemble de se- 
quences produits de maniere stochastique est alors uti- 
lise pour transformer des cellules competentes. 
[0054] Parailleurs, les genes produits de maniere sto- 
chastique clones en procedant conformement aux mo- 

35 des operatoires II et III peuvent etre excises intacts du 
vecteur d'expression pUC8 en utilisant les sites de res- 
triction propres au vecteur de clonage et non represents 
dans I'ADN produit de maniere stochastique. 
[0055] La recombinaison au sein des genes produits 

40 de maniere stochastique engendres par les deux der- 
niers modes operatoires qui viennent d'etre decrits, re- 
combinaison qui resulte de I'homologie interne et des 
motifs de recurrence, fournit une importante methode 
additionnelle de mutagenese in vivo des sequences co- 

45 dantes. II en resulte une augmentation du nombre des 
genes nouveaux qui peuvent etre examines. 
[0056] Finalement, pour tout processus degeneration 
de genes synthetiques nouveaux, on peut utiliser de 
nombreuses techniques usuelles de modification des 

50 genes in vivo ou in vitro, tellesquechangementdu cadre 
de lecture, inversion des sequences par rapport a leur 
promoteur, ou utilisation de souches-hotes exprimant 
un ou plusieurs tRNA suppresseurs. 
[0057] En se referant a la partie de la description qui 

55 precede, on comprendra qu'il est possible de construire 
in vitro un nombre extremement grand (par exemple, su- 
perieur a un milliard) de genes differents, par polymeri- 
sation enzymatique de nucleotides et d'oligonucleoti- 
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des. Cette polymerisation s'effectue selon un processus 
stochastique determine par les concentrations respec- 
tives des nucleotides ou oligonucleotides presents dans 
le milieu de reaction. 

[0058] Comme indique ci-dessus, deux methodes 
peuvent etre utilisees pour doner de tels genes (ou se- 
quences codantes) : la polymerisation peut s'effectuer 
directement sur un vecteur de clonage d'expression, 
prealablement linearise, ou bien on peut choisir de pro- 
ceder sequentiellement a la polymerisation puis a la li- 
gation des polymeres au vecteur de clonage et d'ex- 
pression. 

[0059] Dans les deux cas, on procede ensuite a la 
transformation ou a latransfection de cellules bacterien- 
nes competentes (ou de cellules en culture). Cette eta- 
pe realise le clonage des genes stochastiques dans des 
cellules vivantes ou ils sont indefiniment propages et ex- 
primes. 

[0060] Bien entendu, outre les modes operatoires qui 
viennent d'etre decrits, on pourrait egalement employer 
toute autre methode appropriee pour la synthese de se- 
quences produits de maniere stochastiques. En parti- 
culier, on pourrait proceder a la polymerisation, par voie 
biochimique, d'oligomeres monocatenaires d'ADN ou 
d'ARN obtenus par synthese chimique, puis traiter ces 
segments d'ADN ou d'ARN par des procedes connus 
en soi de preparation de copies d'ADN (c ADN) bicate- 
naire en vue du clonage des genes. 

Criblage ou selection des souches de cellules-notes 
modifiees 

[0061] L'etape ulterieure du procede selon I'invention 
consiste a examiner les cellules transformees ou trans- 
ferees, par selection ou criblage, en vue d'isoler une 
ou plusieurs cellules dont I'ADN transformant ou trans- 
rectal conduise la synthese d'un produit de transcrip- 
tion (ARN) ou de traduction (proteine) possedant une 
propriete souhaitee. Ces proprietes peuvent etre, par 
exemple, enzymatiques, fonctionnelles ou structurelles. 
[0062] Une des particularites les plus remarquables 
du procede selon I'invention est de permettre le criblage 
ou laselection simultanee d'un produit exploitable (ARN 
ou proteine) et de son gene producteur. De surcrolt, 
I'ADN synthetise et clone comme decrit peut etre selec- 
tionne ou crible en vue d'isoler des sequences d'ADN 
constituant un produit en soi, dote de proprietes biochi- 
miques exploitables. 

[0063] On va maintenant decrire, a titre d'exemples 
non limitatifs, des modes operatoires preferentiels pour 
le criblage ou la selection de souches de cellules trans- 
formees ainsi que des proteines nouvelles presentant 
un interet en vue d'applications industrielles ou medica- 
les. 

[0064] L'un de ces modes operatoires resulte de I'idee 
de produire une serie d'anticorps polyclonaux ou mono- 
clonaux, obtenus de maniere connue en soi, dirigee 
contre une proteine ou un autre type de molecule d'in- 



teret biochimique ou medical, cette molecule etant, ou 
pouvant etre rendue, immunogenique, et d'utiliser ces 
anticorps comme sonde pour identifier parmi de tres 
nombreux clones transformes par des genes stochasti- 
5 ques ceux qui reagissent avec ces anticorps. Cette 
reaction resulte de I'homologie de structure existant en- 
tre le polypeptide synthetise par le gene stochastique et 
la molecule initiale. On peut ainsi isoler de nombreuses 
proteines nouvelles se comportant comme des epitopes 
ou determinants antigeniques de la molecule initiale. De 
telles proteines nouvelles sont susceptibles de simuler, 
stimuler, moduler ou bloquer I'effet de la molecule initia- 
le. On comprendra que ce mode de selection ou de cri- 
blage est, en lui-meme, susceptible d'avoir de tres nom- 
breuses applications pharmacologiques et bio-medica- 
les. On va maintenant decrire, a titre d'exemple non li- 
mitatif, ce premier mode operatoire en relation avec un 
cas particulier : 

[0065] L'EGF (epidermal growth factor) est une petite 
proteine presente dans le sang et dont le role est de 
stimuler la croissance des cellules epitheliales. Cet effet 
est obtenu par Interaction de I'EGF avec un recepteur 
specifique situe dans la membrane des cellules epithe- 
liales. 

[0066] On prepare des anticorps diriges contre I'EGF 
par injection chez I'animal d'EGF couple a KLH (keyhole 
limpet hemocyanin) pour augmenter I'immunogenicite 
de I'EGF. Les anticorps anti-EGF des animaux immuni- 
ses sont purifies, par exemple par passage sur une co- 
lonne d'affinite, dont le ligand est I'EGF ou un peptide 
de synthese correspondant a un fragment d'EGF. Les 
anticorps anti-EGF purifies sont utilises comme sonde 
pour le criblage d'un grand nombre de clones bacteriens 
lyses au chloroforme sur support solide. Les anticorps 
anti-EGF se combinent aux peptides ou proteines sto- 
chastiques dont les epitopes ressemblent a ceux de 
I'antigene initial. Les clones contenant ces peptides ou 
proteines sont mis en evidence par autoradiographie 
apres incubation des supports solides avec de la pro- 
teine A radioactive ou apres incubation avec un anti- 
corps anti-anticorps radioactif. 

[0067] Ces etapes identifient les clones contenant 
chacun une proteine (et son gene) reagissant avec I'an- 
ticorps de criblage. On peut ainsi faire des criblages par- 
mi un tres grand nombre de souches cellulaires bacte- 
riennes ou de plaques virales (par exemple de I'ordre 
de un million) et il est possible de detecter des quantites 
extremement faibles, par exemple de I'ordre de 1 ng, de 
proteine produite. On procede alors a la culture des clo- 
nes identifies puis a la purification des proteines detec- 
tees par les moyens conventionnels. Les proteines pu- 
rifiees sont testees in vitro dans des cultures de cellules 
epitheliales pour determiner si elles inhibent, simulent 
ou modulent I'effet sur ces cultures de I'EGF. Certaines 
des proteines obtenues par ce moyen sont susceptibles 
d'etre utilisees pour le traitement chimiotherapique des 
epitheliomes. Les activites des proteines ainsi obtenues 
peuvent etre ameliorees par mutation de I'ADN codant 
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pour les proteines, de maniere analogue a celle decrite 
ci-dessus. Une variante de ce mode operatoire consiste 
a purifier des peptides, polypeptides ou proteines sto- 
chastiques, pouvant etre utilisees comme vaccins ou 
plus generalement pouvant etre utilisees pour conferer 
une immunite contre un agent pathogene ou pour exer- 
cer d'autres effets sur le systeme immunologique, par 
exemple, creer une tolerance ou diminuer I'hypersensi- 
bilite a regard d'un antigene donne, notamment par sui- 
te de la combinaison de ces peptides, polypeptides ou 
proteines avec les anticorps diriges contre cet antigene. 
On comprendra que Ton peut utiliser ainsi ces peptides, 
polypeptides ou proteines aussi bien in vitro qu' in vivo. 
[0068] Plus precisement, par exemple, dans I'ensem- 
ble des proteines nouvelles qui reagissent avec I'anti- 
corps contre un antigene donne X, chacune a au moins 
un epitope en commun avec X, done I'ensemble a un 
ensemble d'epitopes commun avec X. Ceci permet 
d'utiliser I'ensemble ou un sous-ensemble comme vac- 
cin pour conferer I'immunite contre X. II est, par exem- 
ple, aise de purifier une ou plusieurs des proteines de 
capside du virus de I'hepatite B. Ces proteines sont in- 
jectees chez I'animal, par exemple le lapin, et on re- 
cueille les anticorps correspondant a I'antigene de de- 
part par purification sur colonne d'affinite. On utilise ces 
anticorps, de la maniere decrite ci-dessus, pour identi- 
fier les clones produisant une proteine ayant un epitope 
semblable a Tun au moins des epitopes de I'antigene 
initial. Apres purification, on utilise ces proteines comme 
antigene (soit isolement, soit en combinaison) dans le 
but de conferer une protection contre I'hepatite B. La 
production ulterieure du vaccin ne necessite plus le re- 
cours a I'agent pathogene initial. 
[0069] II est a remarquer que, lors de la description 
des modes operatoires qui precedent, un certain nom- 
bres de manieres de proceder a la selection et au cri- 
blage ont ete decrits. Tous ces modes operatoires im- 
pliquent ^purification d'une proteine particuliere a partir 
d'une souche transformer. Ces purifications de protei- 
nes peuvent etre effectuees conformement aux metho- 
des usuelles etfontappel, en particulier, aux techniques 
de chromatographie sur gel, sur echangeur d'ion, et a 
la chromatographie d'affinite. Par ailleurs, les proteines 
issues de genes produits de maniere stochastique peu- 
vent avoir ete donees sous forme de proteines hybri- 
des, comportant, par exemple, une sequence de I'enzy- 
me p-galactosidase permettant la chromatographie 
d'affinites sur anticorps anti-p-galactosidase et permet- 
tant le clivage subsequent de la partie hybride (e'est-a- 
dire permettant de separer la partie nouvelle de la partie 
bacterienne). On va maintenant decrire le principe et la 
mise en oeuvre de la selection des peptides ou polypep- 
tides et des genes correspondants, exprimant ces pep- 
tides ou polypeptides, conformement a une deuxieme 
methode de criblage ou selection fondee sur la detec- 
tion de I'aptitude de ces peptides ou polypeptides aca- 
talyser une reaction specifique. 

[0070] A titre d'exemple concret non limitatif, on va 



decrire la mise en oeuvre du criblage ou de la selection 
dans 1e cas particulier de proteines capables de cata- 
lyser le clivage du lactose, ce qui est normalement une 
fonction remplie par I'enzyme p-galactosidase (P-gal). 
5 [0071] Comme decrit ci-dessus, la premiere etape du 
procede consiste a engendrer un tres grand ensemble 
de vecteurs d'expression exprimant chacun une protei- 
ne nouvelle distincte. De maniere concrete, on peut, par 
exemple, choisir le vecteur d'expression pUC8 avecclo- 
nage de sequences stochastiques d'ADN au site de res- 
triction Pst I. 

Les plasmides ainsi obtenus sont ensuite introduits 
dans une souche de E. coli dans le genome de laquelle 
on a elimine par les methodes genetiques convention- 
nelles le gene naturel pour la p-galactosidase, Z, et un 
deuxieme gene EBG, sans rapport avec le le premier, 
mais capable de muter vers la fonction p-gal. De telles 
cellules-notes (Z~, EBG - ) ne sont pas capables par elles- 
memes de catalyser I'hydrolyse du lactose et, par con- 
sequent, d'utiliser le lactose comme source de carbone 
pour la croissance. Ceci permet d'utiliser cette souche 
note pour le criblage ou la selection de la fonction p-gal. 
[0072] Une methode d'essai biologique qui convient 
pour I'etude des souches transformees de E. coli pre- 
sentantdes genes nouveaux exprimant la fonction p-gal 
consiste dans la culture des bacteries ainsi transfor- 
mees dans des boTtes de Petri renfermant le milieu X- 
gal. Dans ce cas, toute colonie bacterienne exprimant 
une fonction p-gal est visualisee sous forme d'une co- 
lonie bleue. En utilisant un tel essai biologique, on peut 
detecter meme une activite catalytique faible. L'activite 
specifique des enzymes les plus caracteristiques s'eta- 
blit entre 1 0 et 1 0 000 molecules de produit par seconde. 
[0073] En supposant qu'une proteine synthetisee par 
un gene stochastique presente une activite specifique 
faible, de I'ordre de une molecule par 100 secondes, il 
serait toujours possible de detecter une telle activite ca- 
talytique. Dans une boite de Petri renfermant le milieu 
X-gal, en presence de I'inducteur non metabolisable IP- 
TG (isopropyl-D-thiogalactoside) la visualisation d'une 
region bleue requiert le clivage d'environ 10 10 a 10 11 
molecules de X-gal par millimetre carre. Une colonie 
bacterienne exprimant un enzyme faible et occupant 
une superficie de 1 mm 2 contient environ 1 0 7 a 1 0 8 cel- 
lules. Si chaque cellule presente une seule copie de 
I'enzyme faible, chaque cellule doit catalyser entre 10 
000 et 1 00 clivages de X-gal afin de pouvoir etre detec- 
tee, ce qui prend environ 2,7 a 270 heures. Etant donne 
que, dans des conditions selectives, on peut s'attendre 
a une amplification du nombre des copies de plasmides 
par cellules, par exemple de 5 5 a 20 copies par cellule 
et meme de 1 00 a 1 000, et compte tenu du fait que jus- 
qu'a 10% des proteines de la cellule peuvent etre spe- 
cifies par le nouveau gene, la duree necessaire a la 
detection d'une colonie bleue dans le cas de 100 mole- 
cules d'enzymes de faible activite specifique par cellule 
serait de I'ordre de 0,27 heure a 2,7 heures. 
[0074] Par consequent, le criblage d'un grand nombre 
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de colonies bacteriennes independantes, exprimant 
chacun un gene nouveau different, en prenant comme 
critere de selection la faculty d'exprimer la fonction |3- 
gal est parfaitement realisable. On peut ainsi realiser le 
criblage d'environ 2000 colonies dans une boite de Petri 
ordinaire ayant 1 0 cm de diametre. Par consequent, on 
peut cribler environ 20 millions de colonies sur une 
feuille d'agar X-gal de 1 m 2 . 

[0075] II est a remarquer que les colonies bacterien- 
nes apparaissant en bleu sur les boTtes de Petri X-gal 
pourraient etre faussement positives en raison d'une 
mutation dans le genome bacterien lui conferant la ca- 
pacity de metaboliser le lactose, ou pourd'autre raisons 
que cellesqui resultentde I'activite catalytique de la pro- 
teine nouvelle exprimee par les cellules de la colonie. 
De tels faux positifs peuvent etre directement elimines 
en purifiant I'ADN des vecteurs d'expression provenant 
des colonies positives et en retransformant les cellules- 
notes E. Coli Z - , EBG - . Si I'activite |3-gal resulte de la nou- 
velle proteine codee par le nouveau gene dans le vec- 
teur d'expression, toutes les cellules transformees par 
ce vecteur devraient presenter la fonction |3-gal. Au con- 
traire, si la colonie bleue initiale resulte d'une mutation 
dans le genome de la cellule note, il s'agit d'un evene- 
ment exceptionnel independant de la transformation et 
le nombre des cellules de la nouvelle souche transfor- 
mee E. Coli servant d'hote susceptible d'exprimer la 
fonction p-gal devrait etre petit ou nul. 
[0076] On insistera particulierement sur la puissance 
de la purification en masse simultanee des vecteurs 
d'expression pour tous les clones positifs (bleus) suivie 
par la retransformation des bacteries nai'ves. Suppo- 
sons que Ton desire effectuer un criblage en vue de se- 
lectionner des proteines ayant une fonction catalytique 
et que la probability qu'un nouveau peptide ou polypep- 
tide remplisse cette fonction, au moins faiblement, soit 
de 10 -6 , alors que la probability que la souche micro- 
bienne note E. Coli est sujette a une mutation ayant pour 
effet qu'elle devienne capable de remplir cette fonction, 
soit de 1 0 -5 , on peut calculer que sur 20 millions de bac- 
teries transformees soumises au criblage, 20 clones po- 
sitifs seront, en moyenne, attribuables aux genes nou- 
veaux sur les vecteurs d'expression que chacune com- 
porte, alors que 200 clones positifs resulteront de mu- 
tations d'arriere-plan. La purification en masse des vec- 
teurs d'expression de I'integralite des 220 clones bac- 
teriens positifs et la retransformation des bacteries nai'- 
ves avec les vecteurs d'expression mis en commun pro- 
duira un grand nombre de clones positifs constitues de 
toutes les bacteries transformees avec les 20 vecteurs 
d'expression qui codent les nouvelles proteines ayant 
la fonction desiree, et un tres petit nombre de clones 
bacteriens resultant de mutations d'arriere-plan conte- 
nant les 200 vecteurs d'expression restant sans interet. 
Un petit nombre de cycles de purification de vecteurs 
d'expression dans les colonies bacteriennes positives, 
ainsi que de retransformation, permet la detection des 
tres rares vecteurs d'expression veritablement positifs 



par rapport a une activity catalytique desiree, malgre un 
bruit de fond tres eleve de mutations des cellules-notes 
pour cette fonction. 

[0077] A la suite d'operations de criblage de ce genre, 
5 on peut purifier la nouvelle proteine grace a la mise en 
oeuvre de techniques usuelles. La production de cette 
proteine en grande quantity est rendue possible grace 
au fait que I'identification de la proteine utile s'accom- 
pagne de I'identification simultanee du gene codant cet- 
te proteine. 

Par consequent, on peut utiliser le vecteur d'expression 
lui-meme ou bien on peut transplanter le gene nouveau 
dans un vecteur d'expression plus approprie a la syn- 
these et a I'isolation en grande quantity. 
On peut appliquer des modes de criblage de ce genre 
a toute fonction enzymatique pour laquelle il existe un 
essai biologique approprie. De tels criblages ne neces- 
sitent pas que la fonction enzymatique que Ton recher- 
che soit profitable a la cellule note. On peut effectuer un 
criblage non seulement par rapport a une fonction en- 
zymatique mais egalement pour toute autre propriety 
desiree pour laquelle on peut etablir un essai biologique 
approprie. On peut ainsi effectuer meme dans le cas 
simple de la fonction p-gal visualisee sur boTte de Petri 
a milieu X-gal, le criblage d'un nombre de genes nou- 
veaux de I'ordre de 100 millions ou meme d'un milliard 
pour une activity catalytique ou une autre propriety de- 
siree. 

S e l_ectiqn_ d es_c_e II u les-hotes jriodjf iees 

[0078] D'autre part, on peut utiliser des techniques de 
selection pour toute propriety, catalytique ou autre, dont 
la presence ou I'absence peut etre rendue essentielle a 
la survie des cellules-notes contenant les vecteurs d'ex- 
pression codant les genes nouveaux ou pouvant etre 
utiles pour la selection de virus codant et exprimant le 
gene nouveau. A titre d'exemple concret, non limitatif, 
on va maintenant revenir sur la description du mode de 
selection en relation avec la fonction (3-galactosidase. 
Une souche appropriee Z'EBG - d'E. Coli ne peut pas 
croltre en utilisant le lactose comme seule source de 
carbone. Ainsi, apres la mise en oeuvre de la premiere 
etape decrite ci-dessus, on peut cultiver un tres grand 
nombre d'hotes transformes par des vecteurs d'expres- 
sion codant les genes nouveaux, la culture etant effec- 
tuee dans des conditions selectives, soit en diminuant 
progressivement la concentration des autres sources 
de carbone, soit en utilisant seulement le lactose des le 
depart. Au cours d'une telle selection, la mutagenese in 
vivo par voie de recombinaison ou par recuperation ex- 
plicite de vecteurs d'expression et mutagenese in vitro 
de leurs genes nouveaux par des mutagenes varies, ou 
par tout autre technique usuelle, permet des ameliora- 
tions adaptatives de I'aptitude a remplir la fonction ca- 
talytique desiree. Lorsqu'il existe a la foi des techniques 
de selection et des techniques commodes d'essai bio- 
logique, comme dans le cas du present exemple, on 
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peut utiliser initialement des techniques de selection 
pour enrichir la representation en bacteries hote expri- 
mant la fonction (3-gal, puis effectuer un criblage sur boi- 
te de Petri a milieu X-gal afin d'identifier efficacement 
des cellules positives. En I'absence de technique d'es- 5 
sai biologique convenable, I'application de conditions 
de selection de plus en plus rigoureuses constitue la 
voie la plus facile pour purifier un type ou un petit nom- 
bre de types de cellules-hotes distinctes dont les vec- 
teurs d'expression codent les proteines catalysant la 10 
reaction choisie. 

[0079] On peut utiliser ces techniques pour trouver de 
nouvelles proteines ayant une grande variete de carac- 
teristiques structurelles ou fonctionnelles en plus de 
I'aptitude a catalyser des reactions specifiques. Par 15 
exemple, on peut effectuer un criblage ou une selection 
pour trouver de nouvelles proteines se fixant sur des si- 
tes cis-regulateurs de I'ADN et bloquant de ce fait I'ex- 
pression d'une fonction des cellules notes, ou encore 
bloquant latranscription de I'ADN, stimulant la transcrip- 20 
tion, etc. 

[0080] Par exemple, dans le cas de E. Coli une sou- 
che mutante du represseur de I'operon lactose (i-) ex- 
prime de maniere constitutive la fonction (3-gal en raison 
du fait que I'operateur lactose n'est pas reprime. Toutes 25 
les cellules de ce genre produisent des clones bleus sur 
les boTtes de Petri contenant le milieu X-gal. II est pos- 
sible de transformer de telles souches notes avec des 
vecteurs d'expression synthetisant des proteines nou- 
velles et effectuer un criblage sur boTte de Petri a milieu 30 
X-gal en vue de detecter les clones qui ne sont pas 
bleus. Parmi ceux-ci, certains represented des cas ou 
la nouvelle proteine se fixe sur I'operateur lactose et re- 
prime la synthese de (3-gal. On peut purifier en masse 
de tels plasmides, les retransformer , isoler les clones 35 
qui ne produisent pas la (3-gal et effectuer ensuite une 
verification detaillee. 

[0081] Comme il est mentionne plus haut, le procede 
peut etre utilise aux fins de creer puis d'isoler non seu- 
lement des proteines exploitables mais aussi des ARN 40 
et des ADN constituant des produits en soi, dotes de 
proprietes exploitables. Ceci resulte evidemmentdu fait 
que d'une part, le procede consiste a creer des sequen- 
ces stochastiques d'ADN, susceptibles d'interagir direc- 
tement avec d'autres constituants cellulaires ou biochi- 45 
miques, et que d'autre part ces sequences donees dans 
un vecteur d'expression sont transcrites en ARN eux 
aussi capables de multiples interactions biochimiques. 

Exemple de mise en oeuvre du procede pour la creation 50 
et la selection d'un ADN exploitable en soi : 

[0082] Cet exemple illustre la selection d'un ADN ex- 
ploitable et le purification et I'etude du mecanisme d'ac- 
tion des proteines regulatrices se liant a I'ADN. 55 
Soit une preparation du recepteur de I'oestradiol, une 
proteine obtenue par une methode connue en soi. En 
presence d'oestradiol, une hormone steroi'de sexuelle, 



ce recepteur change de conformation et se lie fortement 
a certaines sequences specifiques de I'ADN genomi- 
que, affectant ainsi la transcription de genes impliques 
dans la differenciation sexuelle et le controle de la fer- 
tility. 

En incubant une melange constitue d'oestradiol, de son 
recepteur et d'un grand nombre de sequences stochas- 
tiques differant inserees dans leur vecteur puis en fil- 
trant le melange a travers une membrane de nitro cel- 
lulose on obtient une selection directe des sequences 
stochastiques se liant au complexe oestrogene - recep- 
teur puisque seuls les ADN lies a une proteine sont re- 
tenus par la membrane. Apres lavage et elution, I'ADN 
libere de la membrane est utilise tel quel pour transfor- 
mer des bacteries. Apres culture des bacteries transfor- 
mees, on purifie a nouveau les vecteurs qu'elles con- 
tiennent et on procede a un ou plusieurs cycles d'incu- 
bation, filtration et transformation comme decrit ci-des- 
sus. Ces operations permettent d'isoler des sequences 
stochastiques d'ADN dotees d'une affinite elevee pour 
le complexe oestradiol-recepteur. De telles sequences 
sont susceptibles de nombreuses applications diagnos- 
tiques et pharmacologiques, en particulier pour la mise 
au point d'oestrogenes de synthese pour le controle de 
la fertilite et le traitement de la sterilite. 

Creation et selection d'un ARN exploitable en soi 

[0083] Soit un grand nombre de sequences d'ADN 
stochastique produites comme il a ete decrit et donees 
dans un vecteur d'expression. II va de soi que I'ARN 
transcrit a partir de ces sequences dans des cellules- 
hotes transformees peut etre un produit exploitable en 
soi. 

A titre d'exemple non limitatif, on peut selectionner un 
gene stochastique codant pour un ARN de transfert 
(t-ARN) suppresseur par la procedure suivante : 
[0084] On transforme par un grand nombre (> 1 0 8 ) de 
sequences stochastiques, une souche bacterienne 
competente comportant une mutation "nonsense" dans 
le gene arg E. On etale les bacteries transformees sur 
milieu minimal sans arginine et contenant I'antibiotique 
de selection du plasmide (ampicilline s'il s'agit du vec- 
teur pUC8).Seules les bacteries transformees qui sont 
devenues capables de synthetiser I'arginine pourront 
croTtre. Ce phenotype peut resulter soit d'une mutation 
en retour soit de I'introduction dans la cellule d'un sup- 
presseur. II est facile de tester chaque colonie transfor- 
mee pour determiner si le phenotype arg + resulte ou non 
de la presence du gene produit de maniere stochastique 
dans son vecteur : on se contente de preparer le plas- 
mide de cette colonie et de verifier qu'il confere le phe- 
notype Arg + a toute cellule arg E qu'il transforme. 

Selection de proteines capables de catalyser une se- 
quence de reaction 

[0085] On va maintenant decrire u n autre mode de se- 
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lection, qui est susceptible d'applications independan- 
tes, fonde sur le principe de la selection simultanee, en 
parallele, d'un certain nombre de nouvelles proteines 
capables de catalyser une sequence de reactions con- 
nectees entre elles. 

[0086] L'idee mere de cette methode est la suivante : 
etant donne un ensemble de composes chimiques de 
depart consideres comme des "briques" ou des ele- 
ments de construction a partir desquels on desire effec- 
tuer la synthese d'un ou de plusieurs composes chimi- 
ques desires par I'intermediaire d'une sequence de 
reactions chimiques catalysees, il existe un tres grand 
nombre de voies de reaction pouvant se substituer les 
unes aux autres completement ou en partie, qui sont 
toutes possibles du point de vue thermodynamique et 
qui conduisent de I'ensemble des "briques" ou blocs de 
construction au compose chimique cible desire. Une 
synthese efficace d'un compose cible est favorisee si 
chaque etape d'au moins Tun des trajets reactionnels 
menant de I'ensemble des "blocs de construction" au 
compose cible est constitue de reactions qui sont cha- 
cune catalysees. Toutefois, il est relativement moins im- 
portant de determiner parmi les nombreux chemins 
reactionnels completement ou partiellement indepen- 
dants ceux qui beneficient de la catalyse, Dans la des- 
cription qui precede, on a montre comment il etait pos- 
sible d'obtenir un tres grand nombre de cellules notes 
qui expriment chacune une proteine nouvelle distincte. 
Chacune de ces proteines nouvelles est susceptible de 
catalyser I'une quelconque des reactions possibles 
dans I'ensemble de toutes les reactions possibles con- 
duisant de I'ensemble des blocs de construction au 
compose cible. Si un nombre de proteines stochasti- 
ques suffisamment grand est present dans un melange 
reactionnel contenant les composes constituant les 
blocs de construction, de sorte qu'un nombre suffisam- 
ment eleve des reactions possibles se trouve catalyse, 
il y a une forte probability qu'une sequence de reactions 
connectees entre elles pour conduire de I'ensemble de 
blocs de construction au compose cible sera catalysee 
par un sous-ensemble des nouvelles proteines. II est 
evident que le procede peut s'etendre a la catalyse non 
seulement d'un, mais de plusieurs composes cibles, si- 
multanement. 

[0087] En se fondant sur le principe qui vient d'etre 
enonce, on peut proceder de la maniere suivante pour 
selectionner en parallele un ensemble de nouvelles pro- 
teines catalysant une sequence desiree de reactions 
chimiques : 

1 . Specifier I'ensemble desire de composes consti- 
tuant les "blocs de construction" en utilisant de pre- 
ference un nombre raisonnablement eleve d'espe- 
ces chimiques distinctes afin d'augmenter le nom- 
bre de voies potentielles concurrentes menant au 
compose chimique cible desire. 

2. Dans un volume approprie d'une solution de mi- 



lieu reactionnel, ajouter un nombre tres grand de 
nouvelles proteines stochastiques isolees a partir 
des cellules transformees ou transferees syntheti- 
sant ces proteines. Effectuer un essai pour deter- 

5 miner si le compose cible est forme. Si c'est le cas, 

confirmer que cette formation necessite la presen- 
ce du melange des proteines nouvelles, Si c'est le 
cas, ce melange doit contenir un sous-ensemble de 
proteines catalysant une ou plusieurs sequences 

10 de reaction menant de I'ensemble de "blocs de 
construction" au compose cible. Purifier en divisant 
la reserve initiale de clones qui synthetisent I'en- 
semble de nouvelles proteines. stochastiques, le 
sous-ensemble necessaire pour catalyser la se- 

15 quence de reactions conduisant au produit cible. 

[0088] Plus precisement , a titre d'exemple non limi- 
tatif, on va decrire la selection d'un ensemble de nou- 
velles proteines aptes a catalyser la synthese d'un petit 
20 peptide specifie, a savoir un pentapeptide, a partir d'un 
ensemble de blocs de construction constitue de pepti- 
des plus petits et d'acides amines. Tout peptide est 
constitue par une sequence lineaire de 20 types diffe- 
rents d'acides amines, orientee de son extremite amino 
25 a son extremite carboxe. Tout peptide peut etre forme 
en une etape par condensation terminale de deux pep- 
tides plus petits (ou de deux acides amines), ou par hy- 
drolyse d'un peptide plus grand. Un peptide comprenant 
M residus pourra done etre forme d'un nombre egal a M 
30 -1 reactions de condensation. Le nombre de reactions, 
R, par lequel un ensemble de peptides ayant une lon- 
gueur de 1 , 2, 3... M residus, peut etre interconverti est 
plus grand que le nombre d'especes moleculaires T. Ce- 
ci s'exprime R/ T M-2. Ainsi, en partantd'un ensemble 
35 donne de peptides, un grand nombre de chemins reac- 
tionnels independants ou partiellement independants 
mene a la synthese d'un pentapeptide cible specifique. 
On peut choisir un pentapeptide dont la presence peut 
etre commodement decelee grace a un essai effectue 
40 par des techniques usuelles, par exemple par analyse 
HPLC (chromatographie en phase liquide sous haute 
pression), chromatographie sur papier, etc. La forma- 
tion de la liaison peptidique requiert de I'energie en mi- 
lieu aqueux dilue mais, si les peptides participant aux 
45 reactions de condensation sont suffisamment concen- 
tres, c'est la formation de la liaison peptidique plutot que 
I'hydrolyse qui se trouve thermodynamiquement favori- 
see et qui se produit avec un rendement eleve en pre- 
sence d'un catalyseur enzymatique approprie, par 
50 exemple la pepsine ou la trypsine, sans necessiter la 
presence d'ATP ou d'autres composes a haute energie. 
On peut utiliser un tel melange reactionnel de peptides 
de petite taille et dont les acides amines sont marques 
radioactivement, au moyen de traceurs radioactifs du 
55 type 3 H, 14 C, 35 S, pour constituer I'ensemble de blocs 
de construction a concentration suffisamment elevee 
pour conduire aux reactions de condensation. 
[0089] On peut, par exemple, proceder de la maniere 
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suivante : 

on dissout environ 1 5mg de chaque acide amine et petit 
peptide ayant 2 a 4 acides amines, choisis pour consti- 
tuer I'ensemble de blocs de construction, dans un volu- 
me de 0,25 ml a 1,0 ml de tampon phosphate a 0,1 M, 
pH 7,6. On purifie un grand nombre de proteines nou- 
velles engendrees et isolees comme decrit ci-dessus a 
partir de leur hote bacterien ou autre. On dissout le me- 
lange de ces nouvelles proteines jusqu'a une concen- 
tration totale finale de I'ordre de 0,8 a 1,0 mg/ml, dans 
le meme tampon. On ajoute 0,25 ml a 0,5 ml du melange 
de proteines au melange de blocs de construction. On 
incube a une temperature de 25°C a 40°C pendant 1 a 
40 heures. On enleve des parties aliquotes de 8 ul a 
intervalles reguliers, dont le premier compte comme "te- 
moin a blanc", avant I'adjonction du melange de nouvel- 
les proteines. On soumet les echantillons a une analyse 
par chromatographie en utilisant comme solvant un me- 
lange de n-butanol-acide acetique-pyridine-eau (30:6: 
20:24 en volume). On seche le chromatogramme et on 
le revele a la ninhydrine ou on I'autoradiographie (avec 
ou sans ecran d'intensification). Du fait que les compo- 
ses constituant les elements de construction sont mar- 
ques radioactivement, le compose cible sera radioactif 
et il aura une activite specifique elevee permettant sa 
detection au niveau de 1 a 10 ng. Au lieu de I'analyse 
par chromatographie habituelle, on peut effectuer une 
analyse par HPLC (high pressure liquid chromatogra- 
phy) qui est plus rapide et plus simple a effectuer. De 
maniere generale, on peut utiliser les procedes d'ana- 
lyses usuels. De la sorte, on peut detecter un rendement 
en composes cibles inferieur a une partie par million en 
poids par rapport aux composes ou "materiaux de cons- 
truction" initiaux. 

[0090] Dans le cas ou le pentapeptide est forme dans 
les conditions decrites ci-dessus mais ou sa formation 
n'a pas lieu lorsqu'on utilise un extrait purifie comme ci 
dessus mais obtenu a partir de cellules transformees 
par le vecteur d'expression depourvu d'insertion sto- 
chastique, la formation du pentapeptide ne resulte pas 
de la presence des contaminants bacteriens et requiert 
done la presence d'un sous-ensemble de nouvelles pro- 
teines dans le melange reactionnel. 
[0091] L'etape suivante consiste dans la separation 
du sous-ensemble particulier de cellules qui contien- 
nent les vecteurs d'expression des nouvelles proteines 
catalysant la sequence de reactions conduisant au pen- 
tapeptide cible. Par exemple si le nombre de reactions 
formant cette sequences est egal a 5, il y a environ 5 
proteines nouvelles qui catalysent les reactions neces- 
saire. Dans le cas ou la "banque de clones" de bacteries 
contenant les vecteurs d'expression codant les genes 
nouveaux contient un nombre de genes nouveaux dis- 
tincts de I'ordre de 1 000 000 , on effectue I'isolation en 
masse de tous ces vecteurs d'expression et la ^trans- 
formation de 100 ensembles distincts de 10 8 bacteries 
avec un rapport de vecteurs a bacteries suffisamment 
faible pour que, en moyenne chaque ensemble de bac- 



teries soit transforme par seulement environ la moitie 
du nombre de gene initiaux, e'est-a-dire environ 500 
000. Par consequentja probability pour qu'un quelcon- 
que de ces 100 ensembles de bacteries contienne I'en- 

5 semble des 5 nouvelles proteines critiques est egal a 
(1/2) 5 =1/32. Parmi les 100 ensembles initiaux de bac- 
teries; environ 3 contiendront les 5 transformants criti- 
ques. Dans chacun de ces ensembles, laquantite totale 
de genes nouveaux presente n'est plus que de 500 000 

10 au lieu de un million. Par repetitions successives, dont 
le nombre total est dans le cas present de 20, de cette 
procedure on peut isoler les 5 nouveaux genes criti- 
ques. Apres quoi, la mutagenese et la selection de cet 
ensemble de 5 genes stochastique permet la recherche 

15 de fonctions catalytiques ameliorees. Dans le cas ou il 
est necessaire de catalyser une sequence de reactions 
comprenant un nombre de reactions de I'ordre de 20 et 
que 20 genes codant des nouvelles proteines doivent 
etre isoles en parallele, il suffit d'ajuster la multiplicite 

20 des transformations de sorte que chaque ensemble de 
10 8 bacteries recoivent 80% ces 10 6 genes stochasti- 
ques en utilisant 200 ensembles de ce genre. La proba- 
bility que les 20 nouvelles proteines se trouvent dans 
un ensemble donne de bacteries est de 0,8 20 e'est-a- 

25 dire environ 0,01 5. Par consequent, 2 parmi les 200 en- 
sembles contiendront les 20 nouveaux genes necessai- 
res pour catalyser la formation du compose cible. Le 
nombre de repetitions de cycles necessaires pour I'iso- 
lation des 20 nouveaux genes est de I'ordre de 30. 

30 [0092] Les principes et les modes operatoires enon- 
ces ci-dessus se general isent du cas des peptides a de 
nombreux domaines de la chimie dans lesquels on peut 
effectuer des reactions en milieu aqueux dans des con- 
ditions de pH, temperature et concentration des solu- 

35 tions permettant les fonctions enzymatiques generales. 
Dans chaque cas, il est necessaire de pouvoir disposer 
d'une methode d'essai pour deceler la formation du ou 
des composes cibles desires. II faut aussi choisir un 
nombre suffisamment eleve de "blocs de construction" 

40 pour augmenter le nombre de sequences de reaction 
qui conduisent au compose cible. 
[0093] L'ensemble concret qui vient d'etre donne de 
la synthese d'un pentapeptide cible peut etre generalise 
de la maniere suivante : 

45 [0094] Le procede tel qu'il est decrit, engendre, entre 
autres produits, des peptides et proteines produits de 
maniere stochastique. Ces peptides ou proteines peu- 
vent agir, par voie catalytique ou autre, sur d'autres 
composes, lis peuvent egalement constituer les subs- 

50 trats sur lesquels ils agissent. On peut ainsi selectionner 
(ou cribler) lacapacite qu'ont les peptides ou proteines 
stochastiques d'interagir entre eux et de ce fait de mo- 
difier la conformation, la structure ou la fonction de cer- 
tains d'entre eux. De meme, on peut selectionner (ou 

55 cribler) la capacite de ces peptides et proteines a cata- 
lyser entre eux I'hydrolyse, la condensation, le trans- 
peptidation ou d'autres reactions de modification. Par 
exemple, I'hydrolyse d'une proteine produit de maniere 
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stochastique donnee par un membre au moins de I'en- 
semble des peptides et proteines stochastiques peut 
etre suivie et mesuree par marquage radioactif de la 
proteine donnee suivi d'une incubation avec le melange 
des proteines produits de maniere stochastique, en pre- 5 
sence d'ions tels que Mg, Ca, Zn, Fe et des composes 
ATP et GTP. On mesure ensuite I'apparition des frag- 
ments radioactifs de la proteine marquee, comme il a 
ete decrit. La ou les proteines produites de maniere sto- 
chastique qui catalysent cette reaction peuvent alors 10 
etre isolees, ainsi que leur gene producteur, par diminu- 
tion sequentielle de la librairie de clones transformants, 
comme decrit. 

[0095] Une extension du procede consiste en la se- 
lection d'un ensemble de peptides et polypeptides pro- 15 
duits de maniere stochastique capables de catalyser 
une suite de reactions menant des constituant de depart 
(acides amines et petits peptides) a certains des pepti- 
des ou polypeptides de I'ensemble. II est ainsi envisa- 
geable de selectionner un ensemble capable de cataly- 20 
ser sa propre synthese : un tel ensemble reflexivement 
autocatalytique peut s'etablir dans un chemostat ou les 
produits de reaction sont constamment dilues mais ou 
la concentration des produits de depart est maintenues 
constante. On peut verifier I'existence d'un ensemble de 25 
cette nature par chromatographiesurgel a deux dimen- 
sions et par "HPLC" montrant la synthese d'une distri- 
bution stable de peptides et de polypeptides. Les volu- 
mes de reaction dependent du nombre d'especes mo- 
leculaires utilisees et des concentrations necessaires 30 
pour favoriser la formation de liaisons peptidiques par 
rapport a I'hydrolyse. La distribution des especes mole- 
culaires d'un ensemble autocatalytique est susceptible 
de varier ou de deriver par suite de I'emergence d'en- 
sembles autocatalytiques variants. Les peptides et po- 35 
lypeptides qui constituent un ensemble autocatalytique 
peuvent avoir certains elements en commun avec le 
vaste ensemble de depart (constitue des peptides et po- 
lypeptides codes selon le procede) mais peuvent aussi 
contenir des peptides et polypeptides non codes par 40 
I'ensemble des genes produits de maniere stochastique 
codant I'ensemble de depart. 

[0096] L'ensemble des genes produits de maniere 
stochastique dont les produits sont necessaire pour eta- 
blir un tel ensemble autocatalytique peut etre isole com- 45 
me il a ete decrit, par diminutions sequentielles de la 
libraire de clones transformants. Par ailleurs, un ensem- 
ble autocatalytique peut contenir des peptides codes ini- 
tialement par les genes produits de maniere stochasti- 
que et formes de maniere continue dans I'ensemble 50 
autocatalytique. Pour isoler ce sous-ensemble code de 
peptides et de proteines on peut utiliser I'ensemble 
autocatalytique pour obtenir, par immunisation chez 
I'animal, des serums polyclonaux reconnaissant un tres 
grand nombre des constituants de I'ensemble autoca- 55 
talytique. 

[0097] Ces serums peuvent ensuite etre utilises pour 
cribler la librairie de genes produits de maniere stochas- 



tique pour y trouver les genes exprimant des proteines 
capables de se combiner aux anticorps presents dans 
les serums. 

[0098] Cet ensemble de genes produits de maniere 
stochastique exprime un grand nombre des proteines 
produites de maniere stochastique codees qui persis- 
tent dans I'ensemble autocatalytique. Le reste des 
constituants codes d'un tel ensemble autocatalytique 
peut etre isole par diminution sequentielle, comme de- 
crit, de la librairie de genes produits de maniere stochas- 
tique dont le sous-ensemble detecte par la methode im- 
munologique a ete soustrait. 

[0099] Les ensembles autocatalytiques de peptides 
et de proteines obtenue de la maniere qui vient d'etre 
decrite sont susceptibles de trouver de nombreuses ap- 
plications pratiques. 



Revendications 

1. Methode d' identification d' un peptide, d' un poly- 
peptide or d'une proteine qui se lie a un ligand, com- 
prenant: 

(a) la production d'une population de peptides, 
de polypeptides ou de proteines encodes par 
une population superieure a environ 1 x1 0 5 dif- 
ferentes sequences de polynucleotides produi- 
tes de maniere stochastique, et 

(b) I'examen de ladite population de peptides, 
de polypeptides ou de proteines en vue de la- 
dite liason a ladit ligand dans des conditions qui 
permettent la detection d'un ou de plusieurs 
peptides, polypeptides ou d'une ou de plu- 
sieurs proteines lies a ladit ligand. 

2. Methode de la revendication 1 , caracterisee en ce 

que I'etape (a) comprend en outre la synthese 
d'une population de sequences de polynucleotides 
produites de maniere stochastique et la traduction 
de ladite population de sequences de polynucleoti- 
des pour produire ladite population de peptides, de 
polypeptides ou de proteines. 

3. Methode de la revendication 1 , caracterisee en ce 

que I'etape (a) comprend en outre la synthese 
d'une population de sequences de polynucleotides 
au moins partiellement stochastiques et produites 
de maniere stochastique et la traduction de ladite 
population de sequences de polynucleotides pour 
produire ladite population de peptides, de polypep- 
tides ou de proteines. 

4. Methode de la revendication 2 or 3, comprenant en 
outre I'amplification de ladite population de sequen- 
ces de polynucleotides produites de maniere sto- 
chastique. 
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5. Methode de la revendication 1 , caracterisee en ce 
que I'etape (a) comprend en outre la synthese 
d'une population de sequences de polynucleotides 
produites de maniere stochastique et I'expression 
de ladite population de sequences de polynucleoti- 5 
des pour produire ladite population de peptides, de 
polypeptides ou de proteines. 



6. Methode de la revendication 1 , caracterisee en ce 

que I'etape (a) comprend en outre la synthese 
d'une population de sequences de polynucleotides 
au moins partiellement stochastiques et produites 
de maniere stochastique et I'expression de ladite 
population de sequences de polynucleotides pour 
produire ladite population de peptides, de polypep- 
tides ou de proteines. 

7. Methode de la revendication 1, comprenant en 
outre I'isolementde la sequence de polynucleotides 
encodant un ou plusieurs desdits peptides, poly- 
peptides ou une ou plusieurs proteines qui se lient 
a lad it ligand. 

8. Methode de la revendication 1, comprenant en 
outre ('amelioration de ladite liason a ladit ligand par 
mutagenese in vitro ou in vivo, 

9. Methode de production d'un peptide, d'un polypep- 
tide ou d'une proteine qui se lie a un ligand, com- 
prenant: 

(a) la production d'une population de peptides, 
de polypeptides ou de proteines, encodes par 
une population superieure a environ 1 x1 0 5 se- 
quences de polynucleotides produites de ma- 
niere stochastique, 

(b) I'examen de ladite population de peptides, 
de polypeptides ou de proteines en vue de la- 
dite liason a ladit ligand dans des conditions qui 
permettent la detection d'un ou de plusieurs 
peptides, polypeptides ou d'un ou de plusieurs 
proteines lies a ladit ligand; 

(c) I'isolement de la sequence de polynucleoti- 
des encodant une ou plusieurs desdits pepti- 
des, polypeptides ou proteines qui se lient a la- 
dit ligand, et 

(d) la production dudit peptide, dudit polypepti- 
de ou de ladite proteine. 

10. Methode d'isolement d'une sequence de polynu- 
cleotides encodant un peptide, un polypeptide ou 
une proteine qui se lie a un ligand, comprenant: 

(a) la production d'une population de peptides, 
de polypeptides ou de proteines encodes par 



une population superieure a environ 1x1 0 5 se- 
quences de polynucleotides produites de ma- 
niere stochastique, 

(b) I'examen de ladite population de peptides, 
de polypeptides ou de proteines en vue de la- 
dite liason a ladit ligand dans des conditions qui 
permettent la detection d'un ou de plusieurs 
peptides, polypeptides ou d'un ou de plusieurs 

10 proteines lies a ladit ligand, et 

(c) I'isolement de la sequence ou des sequen- 
ces de polynucleotides encodant ledit peptide, 
ledit polypeptide ou ladtite proteine qui se lie a 

15 un ligand. 

1 1 . Methode de production d'une population diverse de 
sequences de polynucleotides, produites de manie- 
re stochastique, encodant une population diverse 
20 de peptides, de polypeptides ou de proteines Hants, 
comprenant: 

(a) la synthese d'une population diverse de se- 
quences de polynucleotides produites de ma- 

25 niere stochastique, selectionnees par une me- 

thode se composant de la copolymerisation 
stochastique d'oligonucleotides, de la copoly- 
merisation de quatre genres de triphosphates 
de nucleotide se composant de I'adenine, de la 
30 cytosine, de la guanine et de la thymine, et de 

la synthese chimique, et 

(b) I'insertion de ladite population diverse de 
sequences de polynucleotides produites de 

35 maniere stochastique dans une population di- 

verse de vecteurs contenant des sequences de 
polynucleotides produites de maniere stochas- 
tique. 

40 12. Methode de la revendication 11, dont ladite popu- 
lation diverse de sequences des polynucleotides 
produites de la maniere stochastique comprend en 
outre plus d'environ 1x10 5 differentes sequences 
de polynucleotides. 

45 

13. Methode de la revendication 11, dont ladite popu- 
lation diverse de sequences de polynucleotides 
produites de maniere stochastique comprend en 
outre plus d'environ 1x10 6 differentes sequences 

50 de polynucleotides. 

14. Methode de la revendication 11, dont ladite popu- 
lation diverse de sequences de polynucleotides 
produites de maniere stochastique comprend en 

55 outre plus d'environ 1x10 7 differentes sequences 
de polynucleotides. 

15. Methode de la revendication 11, caracterisee en 
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ce que ladite population diverse de sequences de 
polynucleotides produites de maniere stochastique 
comprend en outre plus d'environ 1 x1 0 8 differentes 
sequences de polynucleotides. 

16. Methode de la revendication 11, caracterisee en 
ce que ladite population diverse de sequences de 
polynucleotides produites de maniere stochastique 
contiens au moins un site palindromique de coupu- 
re enzymatique obtenu par copolymerisation sto- 
chastique d'oligonucleotides palindromiques et 
I'etape (b) comprend en outre la digestion de la po- 
pulation diverse de sequences de polynucleotides 
produites de maniere stochastique a I'aide d'une 
enzyme de restriction correspondant a ladite site 
palindromique de coupure enzymatique et la rein- 
sertion des produits digeres dans ladite population 
digeree de vecteurs pour former une population dif- 
ferente ayant un nombre superieur de sequences 
stochastiques de polynucleotides, ladite site palin- 
dromique de coupure enzymatique etant absente 
dans la population originale de vecteurs. 

17. Methode de production d'une population diverse de 
vecteurs, comprenant la copolymerisation stochas- 
tique d'une population diverse de vecteurs conte- 
nant des sequences de polynucleotides produites 
de maniere stochastique a double brin de maniere 
a produite une nouvelle population de vecteurs con- 
tenant plus d'environ 1x10 5 differentes sequences 
de polynucleotides. 

18. Methode de la revendication 17, caracterisee en 
ce que ladite nouvelle population de vecteurs com- 
prend en outre plus d'environ 1x10 6 differentes se- 
quences de polynucleotides. 

19. Methode de la revendication 1 7, dont ladite nouvel- 
le population de vecteurs comprend en outre plus 
d'environ 1x10 7 differentes sequences de polynu- 
cleotides. 

20. Methode de la revendication 17, caracterisee en 
ce que ladite nouvelle population de vecteurs com- 
prend en outre plus de 1 x1 0 8 differentes sequences 
de polynucleotides. 

21. Methode de la revendication 17, caracterisee en 
ce que ladite diverse population de vecteurs com- 
prend deux ou plusieurs diverses populations de 
vecteurs. 

22. Methode de production d'une population diverse de 
vecteurs, comprenant: 

(a) I'obtention d'une ou de plusieurs popula- 
tions diverses de vecteurs contenant des se- 
quences de polynucleotides produites de ma- 



niere stochastique a double brin; 

(b) la digestion d'une ou de plusieurs popula- 
tions diverses a I'aide d'une enzyme de restric- 

5 tion, et 

(c) la copolymerisation stochastique d'une ou 
de plusieurs populations diverses de vecteurs 
contenant des sequences de polynucleotides 

10 produites de maniere stochastique a double 

brin de maniere a produire une nouvelle popu- 
lation de plus d'environ 1x10 5 differentes vec- 
teurs. 

15 23. Methode de production d'une population diverse de 
cellules hotes comprenant: 

(a) la synthese d'une population diverse de se- 
quences de polynucleotides produites de ma- 

20 niere stochastique comprenant plus d'environ 

1x10 5 differentes sequences de polynucleoti- 
des; 

(b) I'insertion de ladite population diverse de 
25 sequences de polynucleotides produites de 

maniere stochastique dans une population de 
vecteurs pour former une population diverse de 
vecteurs contenant des sequences de polynu- 
cleotides produites de maniere stochastique, et 

30 

(c) I'introduction de ladite population diverse de 
vecteurs dans des cellules hotes. 

24. Methode de la revendication 23, dont ladite popu- 
35 lation diverse de sequences de polynucleotides 
produites de maniere stochastique, comprend en 
outre plus d'environ 1x10 6 differentes sequences 
de polynucleotides. 

40 25. Methode de la revendication 23, dont ladite popu- 
lation diverse de sequences de polynucleotides 
produites de maniere stochastique comprend en 
outre plus d'environ 1x10 7 differentes sequences 
de polynucleotides. 

45 

26. Methode de la revendication 23, caracterisee en 
ce que ladite population diverse de sequences de 
polynucleotides produites de maniere stochastique 
comprend en outre plus d'environ 1 x1 0 8 differentes 

50 sequences de polynucleotides. 

27. Methode de la revendication 23, caracterisee en 
ce que ladite population diverse de sequences de 
polynucleotides produites de maniere stochastique 

55 contiens au moins un site palindromique de coupu- 
re enzymatique obtenu par copolymerisation sto- 
chastique d'oligonucleotides palindromiques et 
I'etape (b) comprend en outre la digestion de la po- 
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pulation diverse de sequences des polynucleotides 
produites de maniere stochastique a I'aide d'une 
enzyme de restriction correspondant a ladite site 
palindromique de coupure enzymatique et la rein- 
sertion des produits digeres dans ladite population 
digeree de vecteurs pour former une population dif- 
ferente ayant un nombre superieur de sequences 
de polynucleotides produites de maniere stochasti- 
que, ladite site palindromique de coupure enzyma- 
tique etant absente dans la population originale de 
vecteurs. 

28. Methode de production d'une population diverse de 
cellules notes, comprenant la copolymerisation sto- 
chastique d'une population diverse de vecteurs 
contenant des sequences de polynucleotides pro- 
duites de maniere stochastique a double brin de 
maniere a produire une nouvelle population de 
1x10 5 vecteurs differentes et I'insertion de ladite 
nouvelle population de vecteurs dans des cellules 
hotes. 

29. Methode de la revendication 28, caracterisee en 
ce que ladite nouvelle population de vecteurs com- 
prend en outre plus d'environ 1x10 6 differentes se- 
quences de polynucleotides. 

30. Methode de la revendication 28, dont ladite nouvel- 
le population de vecteurs comprend en outre plus 
d'environ 1x10 7 differentes sequences de polynu- 
cleotides. 

31. Methode de la revendication 28, caracterisee en 
ce que ladite nouvelle population comprend en 
outre plus d'environ 1x10 8 differentes sequences 
de polynucleotides. 

32. Methode de production d'une population diverse de 
cellules hotes, comprenant: 

(a) I'obtention d'une ou de plusieurs popula- 
tions diverses de vecteurs contenant sequen- 
ces de polynucleotides produites de maniere 
stochastique a double brin; 

(b) la digestion d'une ou de plusieurs popula- 
tions diverses de vecteurs a I'aide d'une enzy- 
me de restriction; 

(c) la copolymerisation stochastique d'une ou 
de plusieurs populations diverses de vecteurs 
contenant des sequences stochastiques de po- 
lynucleotides a double brin de maniere a pro- 
duire une nouvelle population de plus d'environ 
1x10 5 vecteurs differentes, et 

(d) I'insertion de ladite nouvelle population de 
vecteurs dans des cellules hotes. 



33. Methode d'identification d'un polynucleotide qui se 
lie a un ligand, comprenant, 

(a) la production d'une population de polynu- 
5 cleotides comprenant plus d'environ 1 x1 0 5 dif- 
ferentes sequences de polynucleotides produi- 
tes de maniere stochastique, et 

(b) I'examen de ladite population de polynu- 
10 cleotides en vue de la liason a ladit ligand dans 

des conditions qui permettent la detection d'un 
ou de plusieurs polynucleotides qui se lient a 
ladit ligand. 

15 34. Methode de la revendication 32, caracterisee en 
ce que I'etape (a) comprend en outre la synthese 
d'une population de sequences de polynucleotides 
produites de maniere stochastique au moins par- 
tiellement stochastiques. 

20 

35. Methode de la revendication 32 ou 33, comprenant 
en outre ('amplification de ladite population de se- 
quences de polynucleotides produites de maniere 
stochastique. 

25 

36. Methode de la revendication 32 a 34, caracterisee 
en ce que I'etape (a) comprend en outre I'expres- 
sion de ladite population de sequences de polynu- 
cleotides produites de maniere stochastique pour 

30 produire ladite population de polynucleotides. 

37. Methode de la revendication 32 a 34, caracterisee 
en ce que ladite population de polynucleotides 
comprend I'ADN. 

35 

38. Methode de la revendication 32 a 34, caracterisee 
en ce que ladite population de polynucleotides 
comprend I'ARN. 

40 39. Methode de la revendication 33, comprenant en 
outre I'isolement d'une ou de plusieurs desdites se- 
quences de polynucleotides qui se lient a ladit li- 
gand. 

45 40. Methode de la revendication 33, comprenant en 
outre ('amelioration de ladite propriete predetermi- 
ne par mutagenese in vitro ou in vivo. 

41. Methode de la revendication 32, caracterisee en 
50 ce que ladite population de polynucleotides com- 
prend plus d'environ 1x10 6 sequences differentes 
de polynucleotides produites de maniere stochasti- 
que. 

55 42. Methode de la revendication 32, caracterisee en 
ce que ladite population de polynucleotides com- 
prend plus d'environ 1x10 7 differentes sequences 
de polynucleotides produites de maniere stochasti- 
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que. 

43. Methode de la revendication 32, caracterisee en 
ce que ladite population de polynucleotides com- 
prend plus d'environ 1x10 8 differentes sequences 
de polynucleotides produites de maniere stochasti- 
que. 

44. Methode de la revendication 32, comprenant en 
outre I'isolement d'une ou de plusieurs sequences 
de polynucleotides ayant ladite propriete predeter- 
minee. 

45. Methode d'identification d'un peptide, d'un polypep- 
tide ou d'une proteine ayant la propriete de modifier 
la transcription, la replication et la stabilite d'une se- 
quence d'ADN, comprenant: 

(a) la production d'une population de peptides, 
de polypeptides ou de proteines, encodes par 
des sequences de polynucleotides produites 
de maniere stochastique, et 

(b) I'examen de ladite population de peptides, 
de polypeptides ou de proteines dans des con- 
ditions qui permettent la detection d'un ou de 
plusieurs peptides, polypeptides ou d'une ou 
de plusieurs proteines, qui modifient la trans- 
cription, la replication ou la stabilite d'une se- 
quence d'ADN. 

46. Methode de la revendication 45, caracterisee en 
ce que I'etape (a) comprend en outre la synthese 
d'une population de sequences de polynucleotides 
produites de maniere stochastique et la traduction 
de ladite population de sequences de polynucleoti- 
des produites de maniere stochastique pour produi- 
re ladite population de peptides, de polypeptides ou 
de proteines. 

47. Methode de la revendication 45, caracterisee en 
ce que I'etape (a) comprend en outre la synthese 
d'une population de sequences de polynucleotides 
produites de maniere stochastique au moins par- 
tiellement stochastiques et la traduction de ladite 
population de sequences de polynucleotides pro- 
duites de maniere stochastique au moins partielle- 
ment stochastiques pour produire ladite population 
de peptides, de polypeptides ou de proteines. 

48. Methode de la revendication 46 ou 47, comprenant 
en outre I'amplification de ladite population de se- 
quences de polynucleotides. 

49. Methode de la revendication 48, caracterisee en 
ce que I'etape (a) comprend en outre la synthese 
d'une population de sequences de polynucleotides 
produites de maniere stochastique et I'expression 



de ladite population de sequences stochastiques 
de polynucleotides pour produire ladite population 
de peptides, de polypeptides ou de proteines. 

5 50. Methode de la revendication 45, caracterisee en 
ce que I'etape (a) comprend en outre la synthese 
d'une population de sequences de polynucleotides 
produites de maniere stochastique au moins par- 
tiellement stochastiques et I'expression de ladite 

10 population de sequences stochastiques de polynu- 
cleotides au moins partiellement stochastiques 
pour produire ladite population de peptides, de po- 
lypeptides ou de proteines. 

15 51. Methode de la revendication 45, comprenant en 
outre I'isolement de la sequence de polynucleotides 
encodant un ou plusieurs desdits peptides, poly- 
peptides ou proteines, qui modifient la transcription, 
la replication ou la stabilite d'une sequence d'ADN. 

20 

52. Methode de modification de la transcription, de la 
replication ou de la stabilite d'une sequence d'ADN, 
comprenant: 

25 (a) la production d'une population de peptides, 

de polypeptides ou de proteines, encodes par 
des sequences de polynucleotides produites 
de maniere stochastique, 

30 (b) I'inspection de ladite population de pepti- 

des, de polypeptides ou de proteines dans des 
conditions qui permettent 1' identification d'un 
ou de plusieurs peptides, polypeptides ou pro- 
teines, qui modifient la transcription, la replica- 

35 tion ou la stabilite d'un sequence d'ADN, et 

(c) la mise en contact d'une sequence d'ADN 
avec un ou plusieurs desdits peptides, polypep- 
tides ou proteines identifiers, qui modifient la 
40 transcription, la replication ou la stabilite d'un 

sequence d'ADN. 

53. Methode de production d'un peptide, d'un polypep- 
tide, ou d'une proteine utile a la preparation d'un 

45 vaccin, comprenant les etapes: 

(a) de production, par couplage enzymatique 
ou chimique, de sequences de polynucleotides 
produites de maniere stochastique; 

50 

(b) de formation d'une bibliotheque de vecteurs 
d'expression contenant de telles sequences de 
polynucleotides produites de maniere stochas- 
tique; 

55 

(c) de la mise en culture de cellules hotes con- 
tenant les vecteurs pour produire des peptides, 
des polypeptides, ou des proteines encodes 
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par les sequences de polynucleotides produi- 
tes de maniere stochastique; 

(d) d'execution de I'examen ou de la selection 
de cellules notes de ce genre, pour identifier un 
peptide produit, un polypeptide produit, ou une 
proteine produite, par les cellules notes ayant 
au moins un epitope similaire a une sequence 
d'acides amines de Tun des epitopes d'un anti- 
gene donne; 

(e) d'isolementd'une sequence de polynucleo- 
tides produites de maniere stochastique qui en- 
code le peptide, le polypeptide, ou la proteine 
identifie(e), et 

(f) d'utilisation de la sequence isolee pour pro- 
duire le peptide, le polypeptide, ou la proteine 
ayant la propriete. 

54. Methode de production d'une population diverse de 
peptides, polypeptides ou proteins Hants, compre- 
nant: 

(a) la synthese d'une population diverse de se- 
quences de polynucleotides produites de ma- 
niere stochastique, selectionnees par une me- 
thode se composant de la copolymerisation 
stochastique d'oligonucleotides, de la copoly- 
merisation de quatre genres de triphosphates 
de nucleotide se composant de I'adenine, de la 
cytosine, de la guanine et de la thymine, et de 
la synthese chimique; 

(b) I'insertion de ladite population diverse de 
sequences de polynucleotides produites de 
maniere stochastique dans une population de 
vecteurs pour former une population diverse de 
vecteurs contenant des sequences de polynu- 
cleotides produites de maniere stochastique, 

(c) I'introduction de ladite population diverse de 
vecteurs contenant des sequences de polynu- 
cleotides produites de la maniere stochastique 
dans des cellules hotes, et 

(d) I'expression d'une population diverse de 
peptides, polypeptides ou proteines Hants par 
ladites cellules hotes contenants ladite popula- 
tion diverse de vecteurs contenants des se- 
quences de polynucleotides produites de ma- 
niere stochastique. 

55. Methode de la revendication 54, dont ladite popu- 
lation diverse des sequences de polynucleotides 
produites de maniere stochastique comprend en 
outre plus d'environ 1x10 5 differentes sequences 
de polynucleotides. 



56. Methode de la revendication 54, dont ladite popu- 
lation diverse des sequences de polynucleotides 
produites de maniere stochastique comprend en 
outre plus d'environ 1x10 6 differentes sequences 

5 de polynucleotides. 

57. Methode de la revendication 54, dont ladite popu- 
lation diverse des sequences de polynucleotides 
produites de maniere stochastique comprend en 

10 outre plus d'environ 1x10 7 differentes sequences 
de polynucleotides. 

58. Methode de la revendication 54, dont ladite popu- 
lation diverse des sequences de polynucleotides 

15 produites de maniere stochastique comprend en 
outre plus d'environ 1x10 8 differentes sequences 
de polynucleotides. 

59. Methode de la revendication 54, caracterisee en 
20 ce que ladite population diverse de sequences de 

polynucleotides produites de maniere stochastique 
contiens au moins un site palindromique de coupu- 
re enzymatique obtenu par copolymerisation sto- 
chastique d'oligonucleotides palindromiques I'eta- 

25 pe (b) comprend en outre la digestion de la popu- 
lation diverse des sequences de polynucleotides 
polynucleotides produites de maniere stochastique 
a I'aide d'une enzyme de restriction correspondant 
a ladite site palindromique de coupure enzymatique 

30 ayant une sequence de reconnaissance absente 
dans la population originale de vecteurs d'expres- 
sion et la reinsertion des produits digeres dans la- 
dite population digeree de vecteurs d'expression 
pour former une population differente ayant un 

35 nombre superieur de sequences de polynucleoti- 
des produites de maniere stochastique, ladite site 
palindromique de coupure enzymatique etant ab- 
sente dans la population originale de vecteurs. 



1. A method of identifying a peptide, a polypeptide or 
a protein which binds to a ligand, comprising: 

(a) the production of a population of peptides, 
polypeptides or proteins encoded by a popula- 
tion of greater than about 1 x 1 0 5 different se- 
quences of polynucleotides produced stochas- 
tically, and 

(b) the examination of said population of pep- 
tides, polypeptides or proteins with a view to 
said binding to said ligand under conditions 
which permit detection of one or more peptides, 
polypeptides or one or more proteins bound to 
said ligand. 

2. A method according to claim 1 characterised in 
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that step (a) further comprises the synthesis of a 
population of sequences of polynucleotides pro- 
duced stochastically and the translation of said pop- 
ulation of sequences of polynucleotides to produce 
said population of peptides, polypeptides or pro- 5 
teins. 

3. A method according to claim 1 characterised in 

that step (a) further comprises the synthesis of a 
population of sequences of polynucleotides which 10 
are at least partially stochastic and produced sto- 
chastically and the translation of said population of 
sequences of polynucleotides to produce said pop- 
ulation of peptides, polypeptides or proteins. 

15 

4. A method according to claim 2 or claim 3 and further 
comprising amplification of said population of se- 
quences of polynucleotides produced stochastical- 
ly- 

20 

5. A method according to claim 1 characterised in 

that step (a) further comprises the synthethis of a 
population of sequences of polynucleotides pro- 
duced stochastically and the expression of said 
population of sequences of polynucleotides to pro- 25 
duce said population of peptides, polypeptides or 
proteins. 

6. A method according to claim 1 characterised in 

that step (a) further comprises the synthethis of a 30 
population of sequences of polynucleotides which 
are at least partially stochastic and produced sto- 
chastically and the expression of said population of 
sequences of polynucleotides to produce said pop- 
ulation of peptides, polypeptides or proteins. 35 

7. A method according to claim 1 further comprising 
the isolation of the sequence of polynucleotides en- 
coding one or more of said peptides, polypeptides 

or one or more proteins which bind to said ligand. 40 



(c) the isolation of the sequence of polynucle- 
otides encoding one or more of said peptides, 
polypeptides or proteins which bind to said lig- 
and, and 

(d) the production of said peptide, said polypep- 
tide or said protein. 

10. A method of isolating a sequence of polynucle- 
otides encoding a peptide, a polypeptide or a pro- 
tein which binds to a ligand, comprising: 

(a) the production of a population of peptides, 
polypeptides or proteins encoded by a popula- 
tion of greater than about 1 x 1 0 5 sequences of 
polynucleotides produced stochastically, 

(b) the examination of said population of pep- 
tides, polypeptides or proteins with a view to 
said binding to said ligand under conditions 
which permit detection of one or more peptides, 
polypeptides or one or more proteins bound to 
said ligand, 

(c) the isolation of the sequence or sequences 
of polynucleotides encoding said peptide, said 
polypeptide or said protein which binds to a lig- 
and. 

11. A method of producing a diverse population of se- 
quences of polynucleotides produced stochastical- 
ly encoding a diverse population of binding pep- 
tides, polypeptides or proteins, comprising: 

(a) the synthethis of a diverse population of se- 
quences of polynucleotides produced stochas- 
tically, selected by a method involving stochas- 
tic copolymerisation of oligonucleotides, copol- 
ymerisation of four kinds of nucleotide triphos- 
phates composed of adenine, cytosine, gua- 
nine and thymine, and chemical synthethis, and 

(b) the insertion of said diverse population of 
sequences of polynucleotides produced sto- 
chastically in a diverse population of vectors 
containing sequences of polynucleotides pro- 
duced stochastically. 

12. A method according to claim 11 wherein said di- 
verse population of sequences of polynucleotides 
produced stochastically further comprises more 
than about 1 x 10 5 different sequences of polynu- 
cleotides. 

13. A method according to claim 11 wherein said di- 
verse population of sequences of polynucleotides 
produced stochastically further comprises more 
than about 1 x 10 6 different sequences of polynu- 
cleotides. 

14. A method according to claim 11 wherein said di- 
verse population of sequences of polynucleotides 



8. A method according to claim 1 further comprising 
the improvement of said binding to said ligand by 
mutagenesis in vitro or in vivo. 

45 

9. A method of producing a peptide, a polypeptide or 
a protein which binds to a ligand, comprising: 

(a) the production of a population of peptides, 
polypeptides or proteins encoded by a popula- 50 
tion of greater than about 1 x 1 0 5 sequences of 
polynucleotides produced stochastically, 

(b) the examination of said population of pep- 
tides, polypeptides or proteins with a view to 
said binding to said ligand under conditions 55 
which permit detection of one or more peptides, 
polypeptides or one or more proteins bound to 
said ligand, 
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produced stochastically further comprises more 
than about 1 x 10 7 different sequences of polynu- 
cleotides. 

15. A method according to claim 11 wherein said di- 5 
verse population of sequences of polynucleotides 
produced stochastically further comprises more 
than about 1 x 10 8 different sequences of polynu- 
cleotides. 

10 

16. A method according to claim 11 characterised in 
that said diverse population of sequences of poly- 
nucleotides produced stochastically contains at 
least one enzymatic cleavage palindromic site ob- 
tained by stochastic copolymerisation of palindro- 15 
mic oligonucleotides and step (b) further comprises 
digestion of the diverse population of sequences of 
polynucleotides produced stochastically by means 

of a restriction enzyme corresponding to said enzy- 
matic cleavage palindromic site and re-insertion of 20 
the products digested in said digested population of 
vectors to form a different population having a 
greater number of stochastic sequences of polynu- 
cleotides, said enzymatic cleavage palindromic site 
being absent in the original population of vectors. 25 

17. A method of producing a diverse population of vec- 
tors comprising stochastic copolymerisation of a di- 
verse population of vectors containing sequences 

of polynucleotides produced stochastically with a 30 
double strand in such a way as to produce a new 
population of vectors containing more than about 1 
x 10 5 different sequences of polynucleotides. 

18. A method according to claim 17 characterised in 35 
that said new population of vectors further compris- 
es more than about 1 x 10 6 different sequences of 
polynucleotides. 

19. A method according to claim 17 wherein said new 40 
population of vectors further comprises more than 
about 1 x 10 7 different sequences of polynucle- 
otides. 

20. A method according to claim 17 characterised in 45 
that said new population of vectors further compris- 
es more than about 1 x 10 8 different sequences of 
polynucleotides. 

21. A method according to claim 17 characterised in 50 
that said diverse population of vectors comprises 
two or more diverse populations of vectors. 

22. A method of producing a diverse population of vec- 
tors, comprising: 55 

(a) obtaining one or more diverse populations 
of vectors containing sequences of polynucle- 



otides produced stochastically with a double 
strand, 

(b) digestion of one or more diverse populations 
by means of a restriction enzyme, and 

(c) stochastic copolymerisation of one or more 
diverse populations of vectors containing se- 
quences of polynucleotides produced stochas- 
tically with a double strand in such a way as to 
produce a new population of more than about 
1 x 1 0 5 different vectors. 

23. A method of producing a diverse population of host 
cells, comprising: 

(a) the synthethis of a diverse population of se- 
quences of polynucleotides produced stochas- 
tically comprising more than about 1 x 10 5 dif- 
ferent sequences of polynucleotides, 

(b) the insertion of said diverse population of 
sequences of polynucleotides produced sto- 
chastically into a population of vectors to form 
a diverse population of vectors containing se- 
quences of polynucleotides produced stochas- 
tically, and 

(c) the introduction of said diverse population 
of vectors into host cells. 

24. A method according to claim 23 wherein said di- 
verse population of sequences of polynucleotides 
produced stochastically further comprises more 
than about 1 x 10 6 different sequences of polynu- 
cleotides. 

25. A method according to claim 23 wherein said di- 
verse population of sequences of polynucleotides 
produced stochastically further comprises more 
than about 1 x 10 7 different sequences of polynu- 
cleotides. 

26. A method according to claim 23 characterised in 
that said diverse population of sequences of poly- 
nucleotides produced stochastically further com- 
prises more than about 1 x 1 0 8 different sequences 
of polynucleotides. 

27. A method according to claim 23 characterised in 
that said diverse population of sequences of poly- 
nucleotides produced stochastically contains at 
least one enzymatic cleavage palindromic site ob- 
tained by stochastic copolymerisation of palindro- 
mic oligonucleotides and step (b) further comprises 
digestion of the diverse population of sequences of 
polynucleotides produced stochastically by means 
of a restriction enzyme corresponding to said enzy- 
matic cleavage palindromic site and re-insertion of 
the products digested in said digested population of 
vectors to form a different population having a 
greater number of sequences of polynucleotides 
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34. A method according to claim 32 characterised in 
that step (a) further comprises the synthethis of a 
population of sequences of polynucleotides pro- 
duced stochastically, which are at least partially sto- 

5 chastic. 

35. A method according to claim 32 or claim 33 further 
comprising the amplification of said population of 
sequences of polynucleotides produced stochasti- 

10 cally. 

36. A method according to one of claims 32 to 34 char- 
acterised in that step (a) further comprises the ex- 
pression of said population of sequences of polynu- 

15 cleotides produced stochastically to produce said 
population of polynucleotides. 

37. A method according to one of claims 32 to 34 char- 
acterised in that said population of polynucle- 

20 otides comprises DNA. 



produced stochastically, said enzymatic cleavage 
palindromic site being absent in the original popu- 
lation of vectors. 

28. A method of producing a diverse population of host 
cells comprising stochastic copolymerisation of a 
diverse population of vectors containing sequences 
of polynucleotides produced stochastically with a 
double strand in such a way as to produce a new 
population of 1 x 1 0 5 different vectors and the inser- 
tion of said new population of vectors in host cells. 

29. A method according to claim 28 characterised in 
that said new population of vectors further compris- 
es more than about 1 x 10 6 different sequences of 
polynucleotides. 

30. A method according to claim 28 wherein said new 
population of vectors further comprises more than 
about 1 x 10 7 different sequences of polynucle- 
otides. 

31. A method according to claim 28 characterised in 
that said new population further comprises more 
than about 1 x 10 8 different sequences of polynu- 
cleotides. 

32. A method of producing a diverse population of host 
cells, comprising: 

(a) obtaining one or more diverse populations 
of vectors containing sequences of polynucle- 
otides produced stochastically with a double 
strand, 

(b) the digestion of one or more diverse popu- 
lations of vectors by means of a restriction en- 
zyme, and 

(c) the stochastic copolymerisation of one or 
more diverse populations of vectors containing 
stochastic sequences of polynucleotides with a 
double strand in such a way as to produce a 
new population of more than about 1 x 1 0 5 dif- 
ferent vectors, and 

(d) the insertion of said new population of vec- 
tors in host cells. 

33. A method of identifying a polynucleotide which 
binds to a ligand, comprising 

(a) the production of a population of polynucle- 
otides comprising more than about 1 x 10 5 dif- 
ferent sequences of polynucleotides produced 
stochastically, and 

(b) the examination of said population of poly- 
nucleotides with a view to said binding to said 
ligand under conditions which permit detection 
of one or more polynucleotides which bind to 
said ligand. 



38. A method according to one of claims 32 to 34 char- 
acterised in that said population of polynucle- 
otides comprises RNA. 

25 

39. A method according to claim 33 further comprising 
the isolation of one or more of said sequences of 
polynucleotides which bind to said ligand. 

30 40. A method according to claim 33 further comprising 
the improvement of said predetermined property by 
mutagenesis in vitro ox in vivo. 

41. A method according to claim 32 characterised in 

35 that said population of polynucleotides comprises 
more than about 1 x 10 6 different sequences of poly- 
nucleotides produced stochastically. 

42. A method according to claim 32 characterised in 
40 that said population of polynucleotides comprises 

more than about 1 x 1 0 7 different sequences of poly- 
nucleotides produced stochastically. 

43. A method according to claim 32 characterised in 
45 that said population of polynucleotides comprises 

more than about 1 x 1 0 8 different sequences of poly- 
nucleotides produced stochastically. 

44. A method according to claim 32 further comprising 
50 the isolation of one or more sequences of polynu- 
cleotides having said predetermined property. 

45. A method of identifying a peptide, a polypeptide or 
protein having the property of modifying the tran- 

55 scription, replication and stability of a sequence of 
DNA, comprising: 

(a) the production of a population of peptides, 
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polypeptides or proteins encoded by sequenc- 
es of polynucleotides produced stochastically, 
and 

(b) the examination of said population of pep- 
tides, polypeptides or proteins under conditions 5 
which permit the detection of one or more pep- 
tides, polypeptides or one or more proteins, 
which modify the transcription, replication or 
stability of a sequence of DNA. 



46. A method according to claim 45 characterised in 
that step (a) further comprises the synthethis of a 
population of sequences of polynucleotides pro- 
duced stochastically and the translation of said pop- 
ulation of sequences of polynucleotides produced 15 
stochastically to produce said population of pep- 
tides, polypeptides or proteins. 

47. A method according to claim 45 characterised in 

that step (a) further comprises the synthethis of a 20 
population of sequences of polynucleotides pro- 
duced stochastically, which are at least partially sto- 
chastic, and the translation of said population of se- 
quences of polynucleotides produced stochastical- 
ly, which are at least partially stochastic, to produce 25 
said population of peptides, polypeptides or pro- 
teins. 

48. A method according to claim 46 or claim 47 further 
comprising the amplification of said population of 30 
sequences of polynucleotides. 

49. A method according to claim 48 characterised in 
that step (a) further comprises the synthethis of a 
population of sequences of polynucleotides pro- 35 
duced stochastically and the expression of said 
population of stochastic sequences of polynucle- 
otides to produce said population of peptides, 
polypeptides or proteins. 

40 

50. A method according to claim 45 characterised in 

that step (a) further comprises the synthethis of a 
population of sequences of polynucleotides pro- 
duced stochastically, which are at least partially sto- 
chastic, and the expression of said population of 45 
stochastic sequences of polynucleotides which are 
at least partially stochastic, to produce said popu- 
lation of peptides, polypeptides or proteins. 

51. A method according to claim 45 further comprising 50 
the isolation of the sequence of polynucleotides en- 
coding one or more of said peptides, polypeptides 

or proteins, which modify the transcription, replica- 
tion or stability of a sequence of DNA. 

55 

52. A method of modifying the transcription, replication 
and stability of a sequence of DNA, comprising: 



(a) the production of a population of peptides, 
polypeptides or proteins encoded by sequenc- 
es of polynucleotides produced stochastically, 

(b) the inspection of said population of pep- 
tides, polypeptides or proteins under conditions 
which permit the identification of one or more 
peptides, polypeptides or one or more proteins, 
which modify the transcription, replication or 
stability of a sequence of DNA, and 

(c) contacting a sequence of DNA with one or 
more of said peptides, polypeptides or proteins 
identified, which modify the transcription, repli- 
cation or stability of a sequence of DNA. 

53. A method of producing a peptide, a polypeptide or 
a protein which is useful for the preparation of a vac- 
cine, comprising the steps: 

(a) production by enzymatic or chemical cou- 
pling of sequences of polynucleotides pro- 
duced stochastically, 

(b) formation of a library of expression vectors 
containing such sequences of polynucleotides 
produced stochastically, 

(c) culturing of host cells containing the vectors 
to produce peptides, polypeptides or proteins 
encoded by sequences of polynucleotides pro- 
duced stochastically, 

(d) execution of examination or selection of 
host cells of that kind to identify a peptide pro- 
duced, a polypeptide produced, or a protein 
produced, by the host cells having at least one 
epitope similar to a sequence of amino acids of 
one of the epitopes of a given antigen, 

(e) isolation of a sequence of polynucleotides 
produced stochastically, which encodes the 
peptide, the polypeptide or the protein identi- 
fied, and 

(f) use of the isolated sequence to produce the 
peptide, the polypeptide or the protein having 
the property. 

54. A method of producing a diverse population of bind- 
ing peptides, polypeptides or proteins, comprising: 

(a) the synthethis of a diverse population of se- 
quences of polynucleotides produced stochas- 
tically, selected by a method involving stochas- 
tic copolymerisation of oligonucleotides, copol- 
ymerisation of four kinds of nucleotide triphos- 
phates composed of adenine, cytosine, gua- 
nine and thymine, and chemical synthethis, 

(b) the insertion of said diverse population of 
sequences of polynucleotides produced sto- 
chastically in a diverse population of vectors to 
form a diverse population of vectors containing 
sequences of polynucleotides produced sto- 
chastically, 
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(c) the introduction of said diverse population 
of vectors containing sequences of polynucle- 
otides produced stochastically into host cells, 
and 

(d) the expression of a diverse population of 5 
binding peptides, polypeptides or proteins by 
said host cells containing said diverse popula- 
tion of vectors containing sequences of polynu- 
cleotides produced stochastically. 

10 

55. A method according to claim 54 wherein said di- 
verse population of sequences of polynucleotides 
produced stochastically further comprises more 
than about 1 x 10 5 different sequences of polynu- 
cleotides. 15 



ganden bindet, aufweisend: 

(a) Die Herstellung eines Bestands an Pepti- 
den, an Polypeptiden oder an Proteinen, die co- 
diert werden von einem Bestand an mehr als 
etwa 1x1 0 5 verschiedenen Sequenzen von Po- 
lynucleotide^ die in stochastiseher Weise her- 
gestellt wurden, und 

(b) die Durchsicht des Bestands an Peptiden, 
an Polypeptiden oder an Proteinen im Hinblick 
auf die Bindung an den Liganden unter Bedin- 
gungen, die das Auffinden eines oder mehrerer 
Peptide, Polypeptide oder Proteine, die an den 
Liganden gebunden sind, erlauben. 



56. A method according to claim 54 wherein said di- 
verse population of sequences of polynucleotides 
produced stochastically further comprises more 
than about 1 x 10 6 different sequences of polynu- 20 
cleotides. 

57. A method according to claim 54 wherein said di- 
verse population of sequences of polynucleotides 
produced stochastically further comprises more 25 
than about 1 x 10 7 different sequences of polynu- 
cleotides. 

58. A method according to claim 54 wherein said di- 
verse population of sequences of polynucleotides 30 
produced stochastically further comprises more 
than about 1 x 10 8 different sequences of polynu- 
cleotides. 

59. A method according to claim 54 characterised in 35 
that said diverse population of sequences of poly- 
nucleotides produced stochastically contains at 
least one enzymatic cleavage palindromic site ob- 
tained by stochastic copolymerisation of palindro- 
mic oligonucleotides and step (b) further comprises 40 
digestion of the diverse population of the sequenc- 
es of polynucleotides produced stochastically by 
means of a restriction enzyme corresponding to 
said enzymatic cleavage palindromic site having a 
recognition sequence absent from the original pop- 45 
ulation of expression vectors and re-insertion of the 
products digested in said digested population of ex- 
pression vectors to form a different population hav- 
ing a greater number of sequences of polynucle- 
otides produced stochastically, said enzymatic 50 
cleavage palindromic site being absent in the orig- 
inal population of vectors. 

Patentanspriiche 55 

1. Verfahren zum Identifizieren eines Peptids, eines 
Polypeptids oder eines Proteins, das an einen Li- 



2. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, dass der Schritt (a) auGerdem die Syn- 
these eines Bestands an Sequenzen von Polynu- 
cleotide^ die in stochastiseher Weise hergestellt 
wurden, und die Ubersetzung des Bestands an Se- 
quenzen von Polynucleotiden zur Herstellung des 
Bestands an Peptiden, an Polypeptiden oder an 
Proteinen aufweist. 

3. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, dass der Schritt (a) auGerdem die Syn- 
these eines Bestands an Sequenzen von Polynu- 
cleotiden, die mindestens teilweise stochastisch 
sind und in stochastiseher Weise hergestellt wur- 
den, und die Ubersetzung des Bestands an Se- 
quenzen von Polynucleotiden zur Herstellung des 
Bestands an Peptiden, an Polypeptiden oder an 
Proteinen aufweist. 

4. Verfahren nach Anspruch 2 oder 3, auGerdem auf- 
weisend die Amplifikation des Bestands an Se- 
quenzen von Polynucleotiden, die in stochastiseher 
Weise hergestellt wurden. 

5. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, dass der Schritt (a) auGerdem die Syn- 
these eines Bestands an Sequenzen von Polynu- 
cleotiden, die in stochastiseher Weise hergestellt 
wurden, und die Expression des Bestands an Se- 
quenzen von Polynucleotiden zur Herstellung des 
Bestands an Peptiden, an Polypeptiden oder an 
Proteinen aufweist. 

6. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, dass der Schritt (a) auGerdem die Syn- 
these eines Bestands an Sequenzen von Polynu- 
cleotiden, die mindestens teilweise stochastisch 
sind und in stochastiseher Weise hergestellt wur- 
den, und die Expression des Bestands an Sequen- 
zen von Polynucleotiden zur Herstellung des Be- 
stands an Peptiden, an Polypeptiden oder an Pro- 
teinen aufweist. 
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7. Verfahren nach Anspruch 1 , au Gerdem aufweisend 
die Isolierung der Sequenz von Polynucleotide!!, 
die eines oder mehrere der Peptide, Polypeptide 
oder Proteine, die an den Liganden binden, codiert. 

5 

8. Verfahren nach Anspruch 1 , au Gerdem aufweisend 
die Verbesserung der Bindung an den Liganden 
durch Mutagenese in vitro oder in vivo. 

9. Verfahren zur Herstdlang eines Peptids, eines Po- 10 
lypeptids oder eines Proteins, das an einen Ligan- 
den bindet, aufweisend; 



(d) die Herstellung des Peptids, des Polypep- 
tids oder des Proteins. 

10. Verfahren zur Isolierung einer Sequenz von Polynu- 35 
cleotiden, die ein Peptid, ein Polypeptid oder ein 
Protein, das an einen Liganden bindet, codiert, auf- 
weisend: 



stands an in stochastischer Weise hergestellten Po- 
lynucleotid-Sequenzen, die einen vielfaltigen Be- 
stand an bindenden Peptiden, Polypeptiden oder 
Proteinen codieren, aufweisend; 

(a) Die Synthese eines vielfaltigen Bestands an 
in stochastischer Weise hergestellten Polynu- 
cleotid-Sequenzen, ausgewahlt nach einem 
Verfahren, das besteht aus der stochastischen 
Copolymerisation von Oligonucleotiden, aus 
der Copolymerisation von vier Arten von Nu- 
cleotid-triphosphaten, die bestehen aus Ade- 
nin, aus Cytosin, aus Guanin und aus Thymin, 
und aus der chemischen Synthese, und 

(b) die Insertion des vielfaltigen Bestands an in 
stochastischer Weise hergestellten Polynu- 
cleotid-Sequenzen in einen vielfaltigen Be- 
stand an Vektoren, die in stochastischer Weise 
hergestellte Polynucleotid-Sequenzen enthal- 
ten. 

12. Verfahren nach Anspruch 11 , bei dem der vielfaltige 
Bestand an in stochastischer Weise hergestellten 
Polynucleotid-Sequenzen au Gerdem mehrals etwa 
1 x1 0 5 verschiedene Polynucleotid-Sequenzen auf- 
weist. 

13. Verfahren nach Anspruch 11 , bei dem der vielfaltige 
Bestand an in stochastischer Weise hergestellten 
Polynucleotid-Sequenzen au Gerdem mehrals etwa 
1 x1 0 6 verschiedene Polynucleotid-Sequenzen auf- 
weist. 

14. Verfahren nach Anspruch 11 , bei dem der vielfaltige 
Bestand an in stochastischer Weise hergestellten 
Polynucleotid-Sequenzen au Gerdem mehrals etwa 
1x10 7 verschiedene Polynucleotid-Sequenzen auf- 
weist. 

15. Verfahren nach Anspruch 11, dadurch gekenn- 
zeichnet, dass der vielfaltige Bestand an in stoch- 
astischer Weise hergestellten Polynucleotid-Se- 
quenzen au Gerdem mehr als etwa 1 x1 0 8 verschie- 
dene Polynucleotid-Sequenzen aufweist. 

16. Verfahren nach Anspruch 11, dadurch gekenn- 
zeichnet, dass der vielfaltige Bestand an Polynu- 
cleotid-Sequenzen, die in stochastischer Weise 
hergestellt wurden, mindestens eine palindromi- 
sche enzymatische Schnittstelle enthalt, die durch 
stochastische Copolymerisation palindromischer 
Oligonucleotide erhalten wurde, und dadurch, dass 
der Schritt (b) au Gerdem den Verdau des vielfalti- 
gen Bestands an Polynucleotid-Sequenzen, die in 
stochastischer Weise hergestellt wurden, mit Hilfe 
eines Restriktionsenzyms, das zu der palindromi- 
schen enzymatischen Schnittstelle passt, und die 



(a) Die Herstellung eines Bestands an Pepti- 40 
den, an Polypeptiden oder an Proteinen, die co- 
diert werden an einem Bestand an mehr als et- 
wa 1 x1 0 5 Sequenzen von Polynucleotide^ die 

in stochastischer Weise hergestellt wurden, 

45 

(b) die Durchsicht des Bestands an Peptiden, 
an Polypeptiden oder an Proteinen im Hinblick 
auf die Bindung an den Liganden unter Bedin- 
gungen, die das Auffinden eines oder mehrerer 
Peptide, Polypeptide oder Proteine, die an den 50 
Liganden gebunden sind, erlauben, und 

(c) die Isolierung der Sequenz oder der Se- 
quenzen von Polynucleotide^ die das Peptid, 
das Polypeptid oder das Protein, das an einen 55 
Liganden bindet, codiert oder codieren. 

11. Verfahren zur Herstellung eines vielfaltigen Be- 



(a) Die Herstellung eines Bestands an Pepti- 
den, an Polypeptiden oder an Proteinen, die co- 15 
diert werden von einem Bestand an mehr als 
etwa 1x10 5 Sequenzen von Polynucleotide^ 

die in stochastischer Weise hergestellt wurden, 

(b) die Durchsicht des Bestands an Peptiden, 20 
an Polypeptiden oder an Proteinen im Hinblick 

auf die Bindung an den Liganden unter Bedin- 
gungen, die das Auffinden eines odex mehrerer 
Peptide, Polypeptide oder Proteine, die an den 
Ligaeden gebunden sind, erlauben, 25 

(c) die Isolierung der Sequenz von Polynucleo- 
tide^ die eines oder mehrere der Peptide, Po- 
lypeptide oder Proteine, die an den Liganden 
binden, codiert und 30 



24 
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erneute Insertion der Verdauprodukte in den ver- 
dauten Bestand an Vektoren, um einen unter- 
schiedlichen Bestand mit einer hoheren Anzahl 
stochastischer Polynucleotid-Sequenzen zu bilden, 
aufweist, wobei die palindromische enzymatische 5 
Schnittstelle in dem Ursprungsbestand an Vektoren 
fehlt. 

17. Verfahren zur Herstellung eines vielfaltigen Be- 
stands an Vektoren, aufweisend die stochastische 10 
Copolimerisation eines vielfaltigen Bestands an 
Vektoren, der Polynucleotid-Sequenzen enthalt, 

die mittels stochastischer Doppelstrangsynthese 
hergestellt wurden, um einen neuen Bestand an 
Vektoren herzustellen, der mehr als etwa 1x1 0 5 ver- 15 
schiedene Polynucleotid-Sequenzen enthalt. 

18. Verfahren nach Anspruch 17, dadurch gekenn- 
zeichnet, dass der neue Bestand an Vektoren au- 
Berdem mehr ais etwa 1 x1 0 6 verschiedene Polynu- 20 
cleotid-Sequenzen aufweist. 

19. Verfahren nach Anspruch 1 7, bei dem der neue Be- 
stand an Vektoren auBerdem mehr als etwa 1x10 7 
verschiedene Polynucleotid-Sequenzen aufweist. 25 

20. Verfahren nach Anspruch 17, dadurch gekenn- 
zeichnet, dass der neue Bestand an Vektoren au- 
Berdem mehr als 1x10 8 verschiedene Polynucleo- 
tid-Sequenzen aufweist. 30 

21. Verfahren nach Anspruch 17, dadurch gekenn- 
zeichnet, dass der vielfaltige Bestand an Vektoren 
zwei oder mehrere vielfaltige Bestande an Vektoren 
aufweist. 35 

22. Verfahren zur Herstellung eines vielfaltigen Be- 
stands an Vektoren, aufweisend; 
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stands an Wirtszellen, aufweisend: 

(a) die Synthese eines vielfaltigen Bestands an 
in stochastischer Weise hergestellten Polynu- 
cleotid-Sequenzen, der mehr als etwa 1x10 5 
unterschiedliche Polynucleotid-Sequenzen 
aufweist, 

(b) die Insertion des vielfaltigen Bestands an in 
stochastischer Weise hergestellten Polynu- 
cleotid-Sequenzen in einen Bestand an Vekto- 
ren, um einen vielfaltigen Bestand an Vektoren, 
der in stochastischer Weise hergestellte Po- 
lynucleotid-Sequenzen aufweist, zu bilden, und 

(c) die Einfuhrung des vielfaltigen Bestands an 
Vektoren in Wirtszellen. 

24. Verfahren nach Anspruch 23, bei der der vielfaltige 
Bestand an Polynucleotid-Sequenzen, die in stoch- 
astischer Weise hergestellt wurden, auBerdem 
mehr als etwa 1x10 6 unterschiedliche Polynucleo- 
tid-Sequenzen aufweist. 

25. Verfahren nach Anspruch 23, bei dem der vielfaltige 
Bestand an Polynucleotid-Sequenzen, die in stoch- 
astischer Weise hergestellt wurden, auBerdem 
mehr als etwa 1x10 7 unterschiedliche Polynucleo- 
tid-Sequenzen aufweist. 

26. Verfahren nach Anspruch 23, dadurch gekenn- 
zeichnet, dass der vielfaltige Bestand an Polynu- 
cleotid-Sequenzen, die in stochastischer Weise 
hergestellt wurden, au Berdem mehr als etwa 1 x1 0 8 
unterschiedliche Polynucleotid-Sequenzen auf- 
weist. 

27. Verfahren nach Anspruch 23, dadurch gekenn- 
zeichnet, dass der vielfaltige Bestand an in stoch- 
astischer Weise hergestellten Polynucleotid-Se- 
quenzen mindestens eine palindromische enzyma- 
tische Schnittstelle, die durch stochastische Copo- 
lymerisation palindromischer Oligonucleotide er- 
halten wurde, enthalt, und dadurch, dass der Schritt 
(b) au Berdem den Verdau des vielfaltigen Bestands 
an in stochastischer Weise hergestellten Polynu- 
cleotid-Sequenzen mit Hilfe eines Restriktionsen- 
zyms, das zu der palindromischen enzymatischen 
Schnittstelle passt, und die erneute Insertion der 
Verdauprodukte in den verdauten Bestand an Vek- 
toren, um einen unterschiedlichen Bestand mit ei- 
ner hoheren Anzahl von in stochastischer Weise 
hergestellten Polynucleotid-Sequenzen zu bilden, 
aufweist, wobei die palindromische enzymatische 
Schnittstelle in dem Ursprungsbestand an Vektoren 
fehlt. 

28. Verfahren zur Herstellung eines vielfaltigen Be- 



(a) das Erhalten eines oder mehrerer vielfalti- 40 
ger Bestande an Vektoren, die Polynucleotid- 
Sequenzen enthalten, die mittels stochasti- 
scher Doppelstrangsynthese hergestellt wur- 
den, 

45 

(b) den Verdau eines oder mehrerer vielfaltiger 
Bestande mit Hilfe eines Restriktionsenzyms, 
und 

(c) die stochastische Copolymerisation eines 50 
oder mehrerer vielfaltiger Bestande an Vekto- 
ren, die Polynucleotid-Sequenzen enthalten, 

die mittels stochastischer Doppelstrangsynthe- 
se hergestellt wurden, um einen neuen Be- 
stand an mehr als etwa 1x10 5 unterschiedli- 55 
chen Vektoren herzustellen. 

23. Verfahren zur Herstellung eines vielfaltigen Be- 
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stands an Wirtszellen, aufweisend die stochasti- 
sche Copolymerisation eines vielfaltigen Bestands 
an Vektoren, der mittels stochastischer Doppel- 
strangsynthese hergestellte Polynucleotid-Se- 
quenzen enthalt, um einen neuen Bestand von 5 
1x10 5 unterschiedlichen Vektoren herzustellen, 
und die Insertion des neuen Bestands an Vektoren 
in Wirtszellen. 

29. Verfahren nach Anspruch 28, dadurch gekenn- 10 
zeichnet, dass der neue Bestand an Vektoren au- 
Berdem mehr als etwa 1x10 6 unterschiedliche Po- 
lynucleotid-Sequenzen aufweist. 

30. Verfahren nach Anspruch 28, bei dem der neue Be- 15 
stand an Vektoren auBerdem mehr als etwa 1x10 7 
unterschiedliche Polynucleotid-Sequenzen auf- 
weist. 

31. Verfahren nach Anspruch 28, dadurch gekenn- 20 
zeichnet, dass der neue Bestand auBerdem mehr 

als etwa 1x10 8 unterschiedliche Polynucleotid-Se- 
quenzen aufweist. 

32. Verfahren zur Herstellung eines vielfaltigen Be- 25 
stands an Wirtszellen, aufweisend: 

(a) die Erhaltung eines oder mehrerer vielfalti- 
ger Bestande an Vektoren, die mittels stocha- 
stischer Doppelstrangsynthese hergestellte 30 
Polynucleotid-Sequenzen enthalten, 

(b) den Verdau eines oder mehrerer vielfaltiger 
Bestande an Vektoren mit Hilfe eines Restrikti- 
onsenzyms, 35 

(c) die stochastische Copolymerisation eines 
oder mehrerer vielfaltiger Bestande an Vekto- 
ren, die stochastische Sequenzen von Doppel- 
strang-Polynucleotiden enthalten, um einen 40 
neuen Bestand an mehr als etwa 1x10 5 unter- 
schiedlichen Vektoren herzustellen, und 

(d) die Insertion des neuen Bestands an Vek- 
toren in Wirtszellen, 45 

33. Verfahren zur Identifizierung eines Polynucleotids, 
das an einen Liganden bindet, aufweisend: 



50 

nes oder mehrerer Polynucleotide, die an den 
Liganden binden, erlauben. 

34. Verfahren nach Anspruch 32, dadurch gekenn- 
zeichnet, dass der Schritt (a) auBerdem die Syn- 
these eines Bestands an mindestens teilweise 
stochastischen Polynucleotid-Sequenzen, die in 
stochastischer Weise hergestellt wurden, aufweist. 

35. Verfahren nach Anspruch 32 oder 33, auBerdem 
aufweisend die Amplifikation des Bestands an Po- 
lynucleotid-Sequenzen, die in stochastischer Wei- 
se hergestellt wurden. 

36. Verfahren nach Anspruch 32 bis 34, dadurch ge- 
kennzeichnet, dass der Schritt (a) auBerdem die 
Expression des Bestands an Polynucleotid-Se- 
quenzen, die in stochastischer Weise hergestellt 
wurden, um den Bestand an Polynucleotiden her- 
zustellen, aufweist. 

37. Verfahren nach Anspruch 32 bis 34, dadurch ge- 
kennzeichnet, dass der Bestand an Polynucleoti- 
den DNS aufweist. 

38. Verfahren nach Anspruch 32 bis 34, dadurch ge- 
kennzeichnet, dass der Bestand an Polynucleoti- 
den RNS aufweist. 

39. Verfahren nach Anspruch 33, auBerdem aufwei- 
send die Isolierung eineroder mehrerer der Polynu- 
cleotid-Sequenzen, die an den Liganden binden. 

40. Verfahren nach Anspruch 33, auBerdem aufwei- 
send die Verbesserung der vorbestimmten Eigen- 
schaft durch Mutaganese in vitro oder in vivo. 

41. Verfahren nach Anspruch 32, dadurch gekenn- 
zeichnet, dass der Bestand an Polynucleotiden 
mehr als etwa 1x10 6 unterschiedliche Polynucleo- 
tid-Sequenzen, die in stochastischer Weise herge- 
stellt wurden, aufweist. 

42. Verfahren nach Anspruch 32, dadurch gekenn- 
zeichnet, dass der Bestand an Polynucleotiden 
mehr als etwa 1x10 7 unterschiedliche Polynucleo- 
tid-Sequenzen, die in stochastischer Weise herge- 
stellt wurden, aufweist. 

43. Verfahren nach Anspruch 32, dadurch gekenn- 
zeichnet, dass der Bestand an Polynucleotiden 
mehr als etwa 1x10 8 unterschiedliche Polynucleo- 
tid-Sequenzen, die in stochastischer Weise herge- 
stellt wurden, aufweist. 

44. Verfahren nach Anspruch 32, auBerdem aufwei- 
send die Isolierung einer oder mehrerer Polynu- 
cleotid-Sequenzen, die die vorbestimmte Eigen- 



(a) die Herstellung eines Bestands an Polynu- 50 
cleotiden, der mehr als etwa 1x10 5 unter- 
schiedliche Polynucleotid-Sequenzen, die in 
stochastischer Weise hergestellt wurden, auf- 
weist, und 

55 

(b) die Durchsicht des Bestands an Polynucleo- 
tiden im Hinblick auf die Bindung an den Ligan- 
den unter Bedingungen, die das Auffinden ei- 
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schaft haben. 

45. Verfahren zur Identifizierung eines Peptids, eines 
Polypeptids oder eines Proteins mit der Eigen- 
schaft, die Transkription, die Replikation und die 
Stabilitat einer DNS-Sequenz zu modifizieren, auf- 
weisend: 

(a) die Herstellung eines Bestands an Pepti- 
den, an Polypeptiden oder an Proteinen, die 
von in stochastischer Weise hergestellten Po- 
lyllucleotid-Sequenzen codiert werden, und 

(b) die Durchsicht des Bestands an Peptiden, 
an Polypeptiden oder an Proteinen unter Be- 
dingungen, die dasAuffinden eines oder meh- 
rerer Peptide, Polypeptide oder Proteine, die 
die Transkription, die Replikation oder die Sta- 
bilitat einer DNS-Sequenz modifizieren, erlau- 
ben. 

46. Verfahren nach Anspruch 45, dadurch gekenn- 
zeichnet, dass der Schritt (a) auGerdem die Syn- 
these eines Bestands an Polynucleotid-Sequen- 
zen, die in stochastischer Weise hergestellt wur- 
den, und die Ubersetzung des Bestands an Polynu- 
cleotid-Sequenzen, die in stochastischer Weise 
hergestellt wurden, um den Bestand an Peptiden, 
an Polypeptiden oder an Proteinen herzustellen, 
aufweist. 

47. Verfahren nach Anspruch 45, dadurch gekenn- 
zeichnet, dass der Schritt (a) auGerdem die Syn- 
these eines Bestands an mindestens teilweise 
stochastischen Polynucleotid-Sequenzen, die in 
stochastischer Weise hergestellt wurden, und die 
Ubersetzung des Bestands an wenigstens teilweise 
stochastischen Polynucleotid-Sequenzen, die in 
stochastischer Weise hergestellt wurden, um den 
Bestand an Peptiden, an Polypeptiden oder an Pro- 
teinen herzustellen, aufweist. 

48. Verfahren nach Anspruch 46 oder 47, auGerdem 
aufweisend die Amplifikation des Bestands an Po- 
lynucleotid-Sequenzen. 

49. Verfahren nach Anspruch 48, dadurch gekenn- 
zeichnet, dass der Schritt (a) auGerdem die Syn- 
these eines Bestands an Polynucleotid-Sequen- 
zen, die in stochastischer Weise hergestellt wur- 
den, und die Expression des Bestands an stocha- 
stischen Polynucleotid-Sequenzen, um den Be- 
stand an Peptiden, an Polypeptiden oder an Protei- 
nen herzustellen, aufweist. 

50. Verfahren nach Anspruch 45, dadurch gekenn- 
zeichnet, dass der Schritt (a) auGerdem die Syn- 
these eines Bestands an wenigstens teilweise 



stochastzschen Polynucleotid-Sequenzen, die in 
stochastischer Weise hergestellt wurden, und die 
Expression des Bestands an stochastischen Se- 
quenzen wenigstens teilweise stochastischer Po- 
5 lynucleotide, um den Bestand an Peptiden, an Po- 

lypeptiden oder an Proteinen herzustellen, auf- 
weist. 

51. Verfahren nach Anspruch 45, auGerdem aufwei- 
10 send die Isolierung der Polynucleotid-Sequenz, die 

eines oder mehrere der Peptide, Polypeptide oder 
Proteine, die die Transkription, die Replikation oder 
die Stabilitat einer DNS-Sequenz modifizieren, co- 
diert. 

15 

52. Verfahren zur Modifizierung der Transkription, der 
Replikation oder der Stabilitat einer DNS-Sequenz, 
aufweisend: 

20 (a) die Herstellung eines Bestands an Pepti- 

den, an Polypeptiden oder an Proteinen, die co- 
diert werden von in stochastiseher Weise her- 
gestellten Polynucleotid-Sequenzen, 

25 (b) die Inspektion des Bestands an Peptiden, 

an Polypeptiden oder an Proteinen unter Be- 
dingungen, die die Identifizierung eines oder 
mehrerer Peptide, Polypeptide oder Proteine, 
die die Transkription, die Replikation oder die 

30 Stabilitat einer DNS-Sequenz modifizieren, er- 

lauben, und 

(c) das in Kontakt bringen einer DNS-Sequenz 
mit einem oder mehreren der identifizierten 
35 Peptide, Polypeptide oder Proteine, die die 

Transkription, die Replikation oder die Stabilitat 
einer DNS-Sequenz modifizieren. 

53. Verfahren zur Herstellung eines zur Gewinnung ei- 
40 nes Impfstoffs brauchbaren Peptids, Polypeptids 

oder Proteins, folgende Schritte aufweisend: 

(a) die Herstellung, durch enzymatische oder 
chemische Kopplung, von in stochastischer 

45 Weise hergestellten Polynucleotid-Sequen- 

zen, 

(b) die Bildung einer Bibliothek von Expressi- 
onsvektoren, die solche, in stochastischer Wei- 

50 se hergestellte, Polynucleotid-Sequenzen ent- 

halt, 

(c) das Anlegen von Kulturen von Wirtszellen, 
die die Vektoren zur Herstellung von Peptiden, 

55 von Polypeptiden oder von Proteinen, die von 

den in stochastischer Weise hergestellten Po- 
lynucleotid-Sequenzen codiert werden, enthal- 
ten, 
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(d) die Durchfuhrung der Durchsicht oder der 
Auswahl von Wirtszellen dieser Art, um ein 
durch die Wirtszellen hergestelltes Peptid, Po- 
lypeptid oder Protein mit mindestens einem 
Epitop, das einer Aminosaure-Sequenz eines 5 
der Epitope eines gegebenen Antigens ahnlich 

ist, zu identifizieren, 

(e) die Isolierung einer in stochastischer Weise 
hergestellten Polynucleotid-Sequenz, die das 10 
identifizierte Peptid, Polypeptid oder Protein 
codiert und 

(f) die Verwendung der isolierten Sequenz zur 
Herstellung des Peptids, des Polypeptids oder 15 
des Proteins mit der Eigenschaft. 

54. Verfahren zur Herstellung eines vielfaltigen Be- 
stands an bindenden Peptiden, Polypeptiden oder 
Proteinen, aufweisend: 20 

(a) die Synthese eines vielfaltigen Bestands an 
in stochastischer Weise hergestellten Polynu- 
cleotid-Sequenzen, ausgewahlt nach einem 
Verfahren, das besteht aus der stochastischen 25 
Copolymerisation von Oligonucleotiden, aus 
der Copolymerisation von vier Arten von Nu- 
cleotid-triphosphaten, die bestehen aus Ade- 
nin, aus Cytosin, aus Guanin und aus Thymin, 
und aus der chemischen Synthese, 30 

(b) die Insertion des vielfaltigen Bestands an in 
stochastischer Weise hergestellten Polynu- 
cleotid-Sequenzen in einen Bestand an Vekto- 
ren, um einen vielfaltigen Bestand an Vektoren, 35 
die in stochastischer Weise hergestellte Po- 
lynucleotid-Sequenzen enthalten, zu bilden, 

(c) die Einfuhrung des vielfaltigen Bestands an 
Vektoren, die Polynucleotid-Sequenzen ent- 40 
halten, die in der stochastischen Weise herge- 
stellt wurden, in Wirtszellen, und 

(d) die Expression eines vielfaltigen Bestands 

an bindenden Peptiden, Polypeptiden oder 45 
Proteinen durch die Wirtszellen, die den vielfal- 
tigen Bestand an Vektoren enthalten, die in 
stochastischer Weise hergestellte Polynucleo- 
tid-Sequenzen enthalten. 

50 

55. Verfahren nach Anspruch 54, bei dem der vielfaltige 
Bestand an in stochastischer Weise hergestellten 
Polynucleotid-Sequenzen auGerdem mehr als etwa 
1x10 5 unterschiedliche Polynucleotid-Sequenzen 
aufweist. 55 

56. Verfahren nach Anspruch 54, bei dem der vielfaltige 
Bestand an in stochastischer Weise hergestellten 



Polynucleotid-Sequenzen auGerdem mehr als etwa 
1x10 6 unterschiedliche Polynucleotid-Sequenzen 
aufweist. 

57. Verfahren nach Anspruch 54, bei dem der vielfaltige 
Bestand an in stochastischer Weise hergestellten 
Polynucleotid-Sequenzen auGerdem mehr als etwa 
1x10 7 unterschiedliche Polynucleotid-Sequenzen 
aufweist. 

58. Verfahren nach Anspruch 54, bei dem der vielfaltige 
Bestand an in stochastischer Weise hergestellten 
Polynucleotid-Sequenzen auGerdem mehr als etwa 
1x10 8 unterschiedliche Polynucleotid-Sequenzen 
aufweist. 

59. Verfahren nach Anspruch 54, dadurch gekenn- 
zeichnet, dass der vielfaltige Bestand an in stoch- 
astischer Weise hergestellten Polynucleotid-Se- 
quenzen mindestens eine palindromische enzyma- 
tische Schnittstelle enthalt, die erhalten wurde 
durch stochastische Copolymerisation palindromi- 
scher Oligonucleotide, dass der Schritt (b) auGer- 
dem den Verdau des vielfaltigen Bestands an Po- 
lynucleotid-Sequenzen, die in stochastischer Wei- 
se hergestellt wurden, mit Hilfe eines Restriktions- 
enzyms, das zu der palindromischen enzymati- 
schen Schnittstelle passt, mit einer Erkennungsse- 
quenz, die in dem Ursprungsbestand von Expres- 
sionsvektoren fehlt, und die erneute Insertion der 
Verdau produkte in den verdauten Bestand an Ex- 
pressionsvektoren, um einen unterschiedlichen Be- 
stand mit einer hoheren Anzahl von in stochasti- 
scher Weise hergestellten Polynucleotid-Sequen- 
zen zu bilden, wobei die palindromische enzymati- 
sche Schnittstelle in dem Ursprungsbestand an 
Vektoren fehlt, aufweist. 
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